در این مطلب، ویدئو Pandas Value_Counts Function | آموزش پاندای پایتون شماره 10 | جداول فرکانس را با درصد ایجاد کنید با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:07:57
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,160 –> 00:00:02,080
در این ویدیو همه چیز را در
2
00:00:02,080 –> 00:00:04,319
مورد تابع شمارش ارزش پاندا خواهید آموخت
3
00:00:04,319 –> 00:00:07,359
، بیایید شروع کنیم
4
00:00:07,520 –> 00:00:09,280
سلام نام من و به کانال من خوش آمدید،
5
00:00:09,280 –> 00:00:11,599
در اینجا من آموزش های پایتون و علوم داده را
6
00:00:11,599 –> 00:00:13,679
آموزش می دهم و می توانید موارد
7
00:00:13,679 –> 00:00:14,080
بیشتری
8
00:00:14,080 –> 00:00:15,679
از جمله آموزش های نوشتاری این
9
00:00:15,679 –> 00:00:17,359
ویدیوها را در سایت من پیدا کنید. وب سایت
10
00:00:17,359 –> 00:00:20,400
به آدرس data g dot io در آموزش امروز
11
00:00:20,400 –> 00:00:21,359
ما
12
00:00:21,359 –> 00:00:23,519
تابع شمارش ارزش پانداها را پوشش خواهیم داد که
13
00:00:23,519 –> 00:00:25,199
به شما امکان می دهد
14
00:00:25,199 –> 00:00:27,599
توزیع فرکانس یک سری پاندا را محاسبه
15
00:00:27,599 –> 00:00:28,480
16
00:00:28,480 –> 00:00:30,320
کنید و نحوه عادی سازی
17
00:00:30,320 –> 00:00:32,640
داده های خود را برای نشان دادن آن به عنوان نسبت
18
00:00:32,640 –> 00:00:34,640
و همچنین توضیح خواهیم داد. شامل داده های از دست رفته
19
00:00:34,640 –> 00:00:37,520
و نحوه اعمال آن به داده های سری گروهی،
20
00:00:37,520 –> 00:00:38,879
بیایید خوب
21
00:00:38,879 –> 00:00:40,960
شروع کنیم، بیایید کدی بنویسیم که
22
00:00:40,960 –> 00:00:43,440
قبلاً هم پانداها و هم numpy را
23
00:00:43,440 –> 00:00:44,559
در اینجا وارد کرده ام
24
00:00:44,559 –> 00:00:47,520
و به ترتیب نام مستعار pd و np را به آنها داده
25
00:00:47,520 –> 00:00:48,960
26
00:00:48,960 –> 00:00:51,280
ام و سپس یک فرهنگ لغت در اینجا ایجاد کردم. که
27
00:00:51,280 –> 00:00:53,440
به فریم داده ما وارد می شود که ما آن را
28
00:00:53,440 –> 00:00:54,640
df می نامیم،
29
00:00:54,640 –> 00:00:56,399
30
00:00:56,399 –> 00:00:58,160
اگر می خواهید ادامه دهید، کد را در توضیحات زیر قرار داده ام،
31
00:00:58,160 –> 00:01:00,239
بیایید نگاهی به شکل قبلی این
32
00:01:00,239 –> 00:01:02,160
قاب داده بیندازیم. ما
33
00:01:02,160 –> 00:01:04,000
وارد تابع شمارش مقادیر
34
00:01:04,000 –> 00:01:05,680
می شویم، بنابراین پنج
35
00:01:05,680 –> 00:01:08,320
رکورد اول را با استفاده از تابع head چاپ
36
00:01:08,320 –> 00:01:10,640
می کنیم و می بینیم که فقط دو ستون
37
00:01:10,640 –> 00:01:12,720
داریم و یکی داریم که سطح
38
00:01:12,720 –> 00:01:14,560
یک کلاس و همچنین تعداد
39
00:01:14,560 –> 00:01:16,640
دانش آموزان هر کلاس را توصیف می کند. کلاس
40
00:01:16,640 –> 00:01:19,680
اکنون برای استفاده از
41
00:01:19,680 –> 00:01:21,040
تابع شمارش ارزش pandas،
42
00:01:21,040 –> 00:01:23,600
لازم نیست که هیچ پارامتری را
43
00:01:23,600 –> 00:01:24,640
مستقیماً ارسال کنید،
44
00:01:24,640 –> 00:01:27,280
اما باید آن را به یک سری اعمال کنید،
45
00:01:27,280 –> 00:01:29,280
در این صورت ما
46
00:01:29,280 –> 00:01:32,240
با استفاده از روش دیکشنری به یک سری دسترسی خواهیم داشت، بنابراین ما
47
00:01:32,240 –> 00:01:33,119
df را می نویسیم
48
00:01:33,119 –> 00:01:35,680
و سپس دانشجویان را در پرانتز مربع
49
00:01:35,680 –> 00:01:36,479
می نویسیم، سپس وقتی این را چاپ می کنیم، مقدار زیرخط را می نویسیم،
50
00:01:36,479 –> 00:01:39,680
51
00:01:39,680 –> 00:01:41,840
می بینیم که
52
00:01:41,840 –> 00:01:43,040
53
00:01:43,040 –> 00:01:45,920
یک شیء سری برگردانده می شود که
54
00:01:45,920 –> 00:01:48,240
شامل تعداد هر یک از مقادیر منحصر به فرد
55
00:01:48,240 –> 00:01:50,320
موجود در ستون دانش آموزان
56
00:01:50,320 –> 00:01:54,240
و همچنین هر چند وقت یکبار این مقادیر رخ می
57
00:01:54,240 –> 00:01:57,280
دهند، به عنوان مثال، مقدار 10.0
58
00:01:57,280 –> 00:01:57,680
هفت
59
00:01:57,680 –> 00:02:00,960
بار در قاب داده رخ می دهد، اکنون
60
00:02:00,960 –> 00:02:02,799
تابع شمارش مقادیر را می
61
00:02:02,799 –> 00:02:05,040
توان برای ستون های غیر عددی نیز اعمال کرد،
62
00:02:05,040 –> 00:02:06,880
به عنوان مثال اگر بخواهیم آن
63
00:02:06,880 –> 00:02:08,639
را در ستون سطح اعمال
64
00:02:08,639 –> 00:02:11,280
کنیم، می توانیم دوباره مقدار زیرخط را بنویسید
65
00:02:11,280 –> 00:02:12,720
66
00:02:12,720 –> 00:02:14,080
و میبینیم که هر یک از
67
00:02:14,080 –> 00:02:15,920
دستههای مختلف شش بار اتفاق میافتد،
68
00:02:15,920 –> 00:02:18,800
حالا شمارش ارزشها عالی هستند،
69
00:02:18,800 –> 00:02:20,080
اما اگر تعجب میکنید که
70
00:02:20,080 –> 00:02:20,800
71
00:02:20,800 –> 00:02:23,280
فراوانی نسبی هر یک از این رخدادها
72
00:02:23,280 –> 00:02:24,800
چقدر است، به این معنی
73
00:02:24,800 –> 00:02:27,440
که میخواهید بدانید چند درصد
74
00:02:27,440 –> 00:02:28,319
از مقادیر
75
00:02:28,319 –> 00:02:31,360
در واقع 10.0 است، ما میتوانیم این کار را با استفاده
76
00:02:31,360 –> 00:02:34,160
از پارامتر normalize برابر واقعی
77
00:02:34,160 –> 00:02:38,959
انجام دهیم، بنابراین مجدداً df دانشآموزان
78
00:02:39,680 –> 00:02:42,480
تعداد مقادیر مقدار را مینویسیم و این بار
79
00:02:42,480 –> 00:02:42,879
80
00:02:42,879 –> 00:02:46,720
مینویسیم normalize برابر درست است آنچه در
81
00:02:46,720 –> 00:02:50,560
اینجا به دست میآوریم یک فرکانس نسبی است که
82
00:02:50,560 –> 00:02:52,879
همه اینها جمع میشوند. به یک برای ایجاد یک
83
00:02:52,879 –> 00:02:53,599
کل،
84
00:02:53,599 –> 00:02:57,680
بنابراین در واقعیت این 41.17 درصد است،
85
00:02:57,680 –> 00:02:59,599
این اطلاعات فوق العاده مفیدی است،
86
00:02:59,599 –> 00:03:00,879
اما همیشه
87
00:03:00,879 –> 00:03:02,720
نمی توان بلافاصله آن را
88
00:03:02,720 –> 00:03:04,560
به درصد تبدیل کرد،
89
00:03:04,560 –> 00:03:06,879
اگر بخواهیم بتوانیم آن را
90
00:03:06,879 –> 00:03:08,560
به درصد تبدیل کنیم، می توانیم به سادگی آن را
91
00:03:08,560 –> 00:03:09,519
ضرب کنیم.
92
00:03:09,519 –> 00:03:12,959
کل سری به دست آمده با 100، بنابراین
93
00:03:12,959 –> 00:03:15,200
میتوانیم این را مستقیماً در اینجا اعمال
94
00:03:15,200 –> 00:03:17,599
کنیم وقتی دوباره این را اجرا میکنیم، اکنون میتوانیم
95
00:03:17,599 –> 00:03:21,040
ببینیم که 41.17 درصد
96
00:03:21,040 –> 00:03:24,000
از اعداد را داریم که توسط 10.0
97
00:03:24,000 –> 00:03:27,599
simila ساخته شدهاند. rly 20.0 29.4 درصد را تشکیل می
98
00:03:27,599 –> 00:03:29,440
دهد اکنون بیایید نگاهی دقیق تر به
99
00:03:29,440 –> 00:03:31,040
قاب داده واقعی بیندازیم تا
100
00:03:31,040 –> 00:03:33,519
ببینیم آیا مقادیر گم شده ای داریم یا نه، می
101
00:03:33,519 –> 00:03:35,360
توانید آموزشی را که در بالا با جزئیات بیشتری این موضوع را پوشش می دهد بررسی کنید،
102
00:03:35,360 –> 00:03:37,040
103
00:03:37,040 –> 00:03:39,040
اما بیایید مستقیماً در آن غوطه ور شویم و می توانیم
104
00:03:39,040 –> 00:03:40,080
از df استفاده کنیم.
105
00:03:40,080 –> 00:03:44,000
روش اطلاعات نقطهای برای چاپ اطلاعات
106
00:03:44,000 –> 00:03:45,599
مربوط به مقادیر از دست رفته،
107
00:03:45,599 –> 00:03:48,080
بنابراین میتوانیم اینجا ببینیم که یک
108
00:03:48,080 –> 00:03:50,239
مقدار در ستون دانشآموزان وجود
109
00:03:50,239 –> 00:03:52,239
ندارد اما به
110
00:03:52,239 –> 00:03:53,360
111
00:03:53,360 –> 00:03:56,560
طور پیشفرض در توزیع
112
00:03:56,560 –> 00:03:58,640
فرکانس ما
113
00:03:58,640 –> 00:03:59,200
114
00:03:59,200 –> 00:04:01,200
ن