در این مطلب، ویدئو Pandas Basics – p.2 Analysis Data with Python and Pandas Tutorial با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:01,119 –> 00:00:03,250
همه به
2
00:00:03,250 –> 00:00:05,589
تجزیه و تحلیل داده های این ثانیه ها با پایتون
3
00:00:05,589 –> 00:00:07,899
و پانداس خوش آمدید ویدیوی آموزشی در این ویدیو
4
00:00:07,899 –> 00:00:09,750
آنچه که در مورد آن صحبت خواهیم کرد این است
5
00:00:09,750 –> 00:00:11,889
که در مورد اصول اولیه پاندا صحبت کنیم، بنابراین
6
00:00:11,889 –> 00:00:13,719
شما اولین قاب داده پاندا خود را مشاهده کرده اید و
7
00:00:13,719 –> 00:00:15,490
چه کاری انجام می دهیم. با آن اما اکنون ما در
8
00:00:15,490 –> 00:00:16,900
واقع خودمان آن را کدگذاری می کنیم و آن
9
00:00:16,900 –> 00:00:19,060
را ادامه می دهیم، بنابراین اگر شما کد قبلی را کپی
10
00:00:19,060 –> 00:00:22,449
و جایگذاری نکرده اید، اساساً
11
00:00:22,449 –> 00:00:23,890
چیزی که قرار است داشته باشیم این است که می توانید
12
00:00:23,890 –> 00:00:26,829
آن کد را کپی و جایگذاری کنید و سپس ما در اینجا
13
00:00:26,829 –> 00:00:29,169
فقط با یک صفحه خالی شروع میکنیم و
14
00:00:29,169 –> 00:00:32,680
به دادههای i/o هم نیازی نداریم، بنابراین
15
00:00:32,680 –> 00:00:34,510
ما اساساً از این چهار خط
16
00:00:34,510 –> 00:00:36,970
در اینجا پانداس به عنوان
17
00:00:36,970 –> 00:00:38,470
PD استفاده میکنیم.
18
00:00:38,470 –> 00:00:39,850
قصد دارید کد خود را به اشتراک بگذارید یا از کسی
19
00:00:39,850 –> 00:00:41,230
بخواهید که در کد شما به شما کمک کند، احتمالاً
20
00:00:41,230 –> 00:00:43,900
باید از استانداردهای matplotlib pipe
21
00:00:43,900 –> 00:00:46,600
lattes PLT از سبک واردات استاندارد matplotlib
22
00:00:46,600 –> 00:00:49,240
استفاده کنید، بنابراین ما می توانیم به سرعت
23
00:00:49,240 –> 00:00:50,770
نمودار خود را کمی جذاب تر
24
00:00:50,770 –> 00:00:53,800
از پیش فرض
25
00:00:53,800 –> 00:00:55,450
کنیم. به جلو بروید و انجام دهید
26
00:00:55,450 –> 00:00:58,630
مثلاً اگر از پایتون میآیید، بیایید بگوییم که اگر
27
00:00:58,630 –> 00:01:00,340
از پایتون میآیید، چارچوب دادهای
28
00:01:00,340 –> 00:01:01,600
pandas به هر دلیلی با شما درست
29
00:01:01,600 –> 00:01:04,150
نمینشیند، یک قاب داده
30
00:01:04,150 –> 00:01:06,609
در قلب خود بسیار شبیه فرهنگ لغت پایتون است
31
00:01:06,609 –> 00:01:08,499
و روشی که ما میتوانیم به آن ارجاع دهیم این است.
32
00:01:08,499 –> 00:01:10,979
مانند یک فرهنگ لغت پایتون در قلب آن است، بنابراین
33
00:01:10,979 –> 00:01:12,850
اول از همه فرض کنید که شما دارید
34
00:01:12,850 –> 00:01:14,799
وب سایت را راه اندازی می کنید، اکنون در
35
00:01:14,799 –> 00:01:16,060
نهایت به داده های مسکن و مواردی از
36
00:01:16,060 –> 00:01:17,560
این دست می پردازیم، اما در حال حاضر فقط از یک مثال بسیار ابتدایی استفاده می
37
00:01:17,560 –> 00:01:19,659
کنیم، فرض کنید شما. یک
38
00:01:19,659 –> 00:01:22,929
وبسایت دارم، شما مقداری وب دارید، من به
39
00:01:22,929 –> 00:01:25,149
آمار فکر میکردم و دادهها را تایپ میکنم و سپس
40
00:01:25,149 –> 00:01:28,659
یکی از آنها خوب بود، بله، برخی میگویند
41
00:01:28,659 –> 00:01:30,460
شما اطلاعاتی در اینجا دارید، بیایید بگوییم که
42
00:01:30,460 –> 00:01:33,069
اولین بیت اطلاعات روز
43
00:01:33,069 –> 00:01:35,679
است و سپس ما یک لیست
44
00:01:35,679 –> 00:01:38,429
در اینجا خواهم داشت، این روز 1 2 3 4 5 و 6 خواهد بود
45
00:01:38,429 –> 00:01:41,579
و پس از آن شاید شما
46
00:01:41,579 –> 00:01:44,350
بازدید کننده داشته باشید و همچنین اگر
47
00:01:44,350 –> 00:01:46,450
با فرهنگ لغت آشنا نیستید، من آموزش اصولی لغت نامه ها را دارم که
48
00:01:46,450 –> 00:01:48,630
49
00:01:48,630 –> 00:01:51,609
قابل درک است. آن را اگر
50
00:01:51,609 –> 00:01:53,139
فقط به دیدن آن آموزش بروید بازدید سریع
51
00:01:53,139 –> 00:01:55,270
واقعی rs ما یک
52
00:01:55,270 –> 00:01:56,649
وب سایت خیلی محبوب نیستیم، بنابراین ما واقعاً
53
00:01:56,649 –> 00:01:58,760
بازدیدکنندگان زیادی نداریم
54
00:01:58,760 –> 00:02:02,090
64 34 من فکر می کنم این شش درست است، بله
55
00:02:02,090 –> 00:02:05,600
شش و در نهایت نرخ پرش، بنابراین
56
00:02:05,600 –> 00:02:07,670
این میزان تعداد افرادی است
57
00:02:07,670 –> 00:02:10,310
که در یک صفحه فرود به شما مراجعه می کنند. و
58
00:02:10,310 –> 00:02:14,630
فوراً چیزی را که می خواهید رها نکنید 65 70
59
00:02:14,630 –> 00:02:19,790
تا 60 تا 64 و 54 و این شش نیست پس
60
00:02:19,790 –> 00:02:24,050
یک ماه شصت و شش عالی است، خوب است،
61
00:02:24,050 –> 00:02:25,970
بنابراین در واقع احتمالاً میانگین صنعت است،
62
00:02:25,970 –> 00:02:27,830
بنابراین 65 درصد از افرادی که
63
00:02:27,830 –> 00:02:30,040
به وب سایت شما می آیند بلافاصله
64
00:02:30,040 –> 00:02:31,400
شوکه کننده را ترک می
65
00:02:31,400 –> 00:02:35,300
کنند. مسئله این است که اکنون این را به
66
00:02:35,300 –> 00:02:37,430
یک قاب داده تبدیل کنید، همیشه
67
00:02:37,430 –> 00:02:39,230
به این سادگی نیست، اما با
68
00:02:39,230 –> 00:02:40,760
فرهنگ لغت به این دلیل است که فرهنگ لغت
69
00:02:40,760 –> 00:02:43,580
به راحتی با یک قاب داده مطابقت دارد، بنابراین
70
00:02:43,580 –> 00:02:47,000
می توانیم بگوییم DF برابر با PD است که
71
00:02:47,000 –> 00:02:49,190
اکنون به پانداس ارجاع می دهد، جایی که من می گویم قاب داده
72
00:02:49,190 –> 00:02:52,580
پانداس در آنجا به بزرگی D
73
00:02:52,580 –> 00:02:56,930
بزرگ F بزرگ توجه کنید و سپس آمار وب رونق گرفت،
74
00:02:56,930 –> 00:02:59,030
ما برای خودمان یک قاب داده ایجاد کردهایم،
75
00:02:59,030 –> 00:03:01,670
حالا وقتی با پانداس کار میکنید و
76
00:03:01,670 –> 00:03:03,950
تغییراتی را انجام میدهید یا چیزی را به عنوان یک
77
00:03:03,950 –> 00:03:05,930
قاب داده درست میکنید که فقط میدانید فقط
78
00:03:05,930 –> 00:03:08,330
بنویسید. من مطمئن هستم که شما می دانید
79
00:03:08,330 –> 00:03:10,190
که یک قاب داده ایجاد کرده است، اما من نمی توانم
80
00:03:10,190 –> 00:03:13,040
آن را ببینم به همین دلیل است که مردم عاشق اکسل هستند و
81
00:03:13,040 –> 00:03:14,360
به همین دلیل است که مردم اکسل را بیش از برنامه نویسی دوست دارند،
82
00:03:14,360 –> 00:03:16,040
زیرا با اکسل می توانند
83
00:03:16,040 –> 00:03:18,530
آن را به خوبی با پانداسی افسانه ای
84
00:03:18,530 –> 00:03:20,180
ببینند، شما می توانید آن را به صورت بصری ببینید. همچنین کاری که
85
00:03:20,180 –> 00:03:22,340
میتوانید انجام دهید این است که میتوانید بگویید چاپ میتوانید
86
00:03:22,340 –> 00:03:24,230
کل قاب داده را چاپ کنید، بنابراین DF و
87
00:03:24,230 –> 00:03:27,770
دوباره DF فقط به صورت مختصر استفاده میشود، این
88
00:03:27,770 –> 00:03:29,420
یک استاندارد است به طور کلی اگر یک قاب داده بسازید،
89
00:03:29,420 –> 00:03:32,180
آن را DF مینامید، اما غنی
90
00:03:32,180 –> 00:03:33,830
نیست که کمترین آن است. محدود کننده
91
00:03:33,830 –> 00:03:37,280
همه این استانداردها است، اگر میخواهید
92
00:03:37,280 –> 00:03:38,959
فریم دادهتان را چیز دیگری بنامید، مانند
93
00:03:38,959 –> 00:03:41,540
قبل از اینکه آن را نامیده بودیم، فکر میکنم exo-m
94
00:03:41,540 –> 00:03:44,540
این بود، حداقل منطقی
95
00:03:44,540 –> 00:03:47,300
است که نام آن متغیر را داشته باشید، بهخصوص
96
00:03:47,300 –> 00:03:48,500
اگر میخواهید بروید. برای داشتن پنج
97
00:03:48,500 –> 00:03:50,959
فریم داده بسیار نامشخص خواهد بود
98
00:03:50,959 –> 00:03:52,790
حتی اگر آنها را DF یکی دو سه
99
00:03:52,790 –> 00:03:54,590
چهار پنج بنامید که واقعاً نامرتب
100
00:03:54,590 –> 00:03:56,090
است، بهتر است آنها را چیزی
101
00:03:56,090 –> 00:03:58,010
بنامید که مربوط به قاب تخت باشد، بنابراین
102
00:03:58,010 –> 00:04:00,950
به هر حال، بنابراین می توانید این را صدا کنید. شما می دانید
103
00:04:00,950 –> 00:04:02,540
آمار یا s چیزی شبیه به آن، اما ما آن را
104
00:04:02,540 –> 00:04:04,070
فقط قاب داده می نامیم تا بتوانید
105
00:04:04,070 –> 00:04:05,959
قاب داده f5 را پرینت بگیرید تا آن را ذخیره کنید
106
00:04:05,959 –> 00:04:09,140
و در آنجا اطلاعات خود را داریم
107
00:04:09,140 –> 00:04:11,660
، متوجه خواهید شد که دوباره 0 1 2 3
108
00:04:11,660 –> 00:04:12,360
4 5 را
109
00:04:12,360 –> 00:04:16,260
در اینجا دریافت کرده ایم. اگر
110
00:04:16,260 –> 00:04:18,180
نمایه ای را مشخص نکنید، اکنون
111
00:04:18,180 –> 00:04:22,230
112
00:04:22,230 –> 00:04:23,430
113
00:04:23,430 –> 00:04:25,650
114
00:04:25,650 –> 00:04:27,870
این
115
00:04:27,870 –> 00:04:30,900
شاخص است. ما در مورد این صحبت خواهیم کرد
116
00:04:30,900 –> 00:04:32,460
که چرا شما این کار را در یک لحظه انجام می دهید
117
00:04:32,460 –> 00:04:34,980
که کل قاب داده ما است، به طوری
118
00:04:34,980 –> 00:04:37,440
که اکنون شش ردیف است، اکنون می توانید
119
00:04:37,440 –> 00:04:41,310
فقط به یک بخش خاص با انجام چاپ
120
00:04:41,310 –> 00:04:44,940
سر DF ارجاع دهید و دو هد دارید که فقط
121
00:04:44,940 –> 00:04:47,700
پنج ردیف اول را به صفر چاپ می کند.
122
00:04:47,700 –> 00:04:51,080
چهار مورد برعکس ما میتوانیم دم نقطهای DF را نیز انجام دهیم
123
00:04:51,080 –> 00:04:55,010
و پنج نقطه آخر را چاپ میکند در
124
00:04:55,010 –> 00:04:59,100
نهایت کاری که ما میتوانیم انجام دهیم این است که شما میتوانید انجام دهید،
125
00:04:59,100 –> 00:05:00,870
شاید فقط میخواهید دو تای آخر را به خوبی چاپ
126
00:05:00,870 –> 00:05:03,330
کنید و میتوانید 2 را به عنوان پارامتر در آنجا پرتاب کنید
127
00:05:03,330 –> 00:05:05,730
و این فقط چاپ میشود.
128
00:05:05,730 –> 00:05:08,520
دو ستون آخر به طوری که درست
129
00:05:08,520 –> 00:05:11,040
در اینجا زیبا خواهد بود خیلی خوب است،
130
00:05:11,040 –> 00:05:12,900
بنابراین شما می بینید که
131
00:05:12,900 –> 00:05:15,120
اساساً هر بار که می دانید از هد df/de استفاده می کنید،
132
00:05:15,120 –> 00:05:17,040
شاید یک محاسبات یک
133
00:05:17,040 –> 00:05:19,200
ستون جدید بر اساس منطق یا چیزی
134
00:05:19,200 –> 00:05:21,060
شبیه به آن ایجاد کنید، همیشه ایده خوبی است که فقط به
135
00:05:21,060 –> 00:05:23,070
نوعی خروجی آن فریم داده را
136
00:05:23,070 –> 00:05:24,570
به کنسول، بنابراین شما واقعاً بتوانید ببینید که چه
137
00:05:24,570 –> 00:05:27,150
کاری انجام میدهید، اگر در اکثر
138
00:05:27,150 –> 00:05:30,840
ویرایشگرهای توسعه تعاملی کار میکنید،
139
00:05:30,840 –> 00:05:33,240
به هر حال هر
140
00:05:33,240 –> 00:05:36,000
بار که آن را دوباره تعریف میکنید، چارچوب داده را خواهید دید، بنابراین این یکی
141
00:05:36,000 –> 00:05:37,919
از امتیازات استفاده از یک نوتبوک پایتون چشمی است.
142
00:05:37,919 –> 00:05:39,600
خیلیها از
143
00:05:39,600 –> 00:05:40,919
من میپرسند هی مرد، شما تا به حال
144
00:05:40,919 –> 00:05:43,710
نام نوتبوک ipython را شنیدهاید، بله، من
145
00:05:43,710 –> 00:05:46,290
دارم آنها را خیلی دوست ندارم، سعی میکنم خیلی بدشان را
146
00:05:46,290 –> 00:05:48,330
دوست داشته باشم، فقط به
147
00:05:48,330 –> 00:05:52,800
هر حال به آنها میگویم که این کار باعث از بین رفتن
148
00:05:52,800 –> 00:05:54,150
واقعیت است. قاب داده تا بتوانید ببینید
149
00:05:54,150 –> 00:05:56,220
اکنون چه کار می کنید، بیایید ایندکس را تنظیم کنیم که چرا
150
00:05:56,220 –> 00:05:59,370
ممکن است در ایندکس داشته باشیم اول از همه،
151
00:05:59,370 –> 00:06:01,919
ایندکس اساساً این است که چگونه همه
152
00:06:01,919 –> 00:06:05,010
داده های شما به هم مرتبط هستند یا چگونه می خواهید
153
00:06:05,010 –> 00:06:08,940
آنها را مرتبط تجسم کنید، بنابراین برای ما شاید
154
00:06:08,940 –> 00:06:12,630
ما می خواهم روز را به هم ربط دهم اما y
155
00:06:12,630 –> 00:06:16,080
میدانید واضحترین شاخص برای این
156
00:06:16,080 –> 00:06:18,210
دادهها روز درست است، بنابراین اگر هر
157
00:06:18,210 –> 00:06:21,150
نوع داده سری زمانی دارید، به طور کلی این
158
00:06:21,150 –> 00:06:23,660
فهرست همان روز است،
159
00:06:23,660 –> 00:06:25,190
اما اگر وبسایتی دارید،
160
00:06:25,190 –> 00:06:27,230
شاید بخواهید فهرست شما بازدیدکننده باشد و
161
00:06:27,230 –> 00:06:28,639
سپس میخواهید بدانید که میدانید شاید
162
00:06:28,639 –> 00:06:30,889
چه چیزهایی هستند که میدانید
163
00:06:30,889 –> 00:06:32,389
بازدیدکنندگان دارید، اما پس از آن
164
00:06:32,389 –> 00:06:34,250
نرخ پرش نیز دارید و شاید
165
00:06:34,250 –> 00:06:36,320
ارجاعها و مواردی از این قبیل را میشناسید و
166
00:06:36,320 –> 00:06:39,110
میخواهید ببینید که چگونه همه چیز
167
00:06:39,110 –> 00:06:42,050
با یک نقطه داده خاصی مانند
168
00:06:42,050 –> 00:06:43,520
تعداد بازدیدکنندگان یا چیزی شبیه به آن، شما می دانید
169
00:06:43,520 –> 00:06:45,229
که هرگز نمی دانید چه کاری می خواهید انجام دهید
170
00:06:45,229 –> 00:06:48,229
و می توانید چندین نمایه
171
00:06:48,229 –> 00:06:50,960
172
00:06:50,960 –> 00:06:52,669
173
00:06:52,669 –> 00:06:55,010
داشته باشید. اما
174
00:06:55,010 –> 00:06:57,919
دلیل زیادی برای پوشش دادن آن در حال حاضر وجود ندارد،
175
00:06:57,919 –> 00:06:59,450
بنابراین راهی که میتوانید ایندکس را تنظیم کنید،
176
00:06:59,450 –> 00:07:04,550
فقط زیرخط دو مجموعه نقطه DF است و
177
00:07:04,550 –> 00:07:06,979
اگر امروز کاری شبیه به
178
00:07:06,979 –> 00:07:11,650
این شاخص مجموعه نقطهای EF را چاپ کنم، امروز خواهیم گفت. و
179
00:07:11,650 –> 00:07:15,710
اجرا کنید تا ببینید بازگشت
180
00:07:15,710 –> 00:07:19,850
کل داده است یک فریم با DES که اکنون
181
00:07:19,850 –> 00:07:22,070
شاخص است، اما بعداً به
182
00:07:22,070 –> 00:07:23,600
شما میرویم که برنامهنویسان حماسی باشید،
183
00:07:23,600 –> 00:07:25,280
ما یک سری محاسبات انجام
184
00:07:25,280 –> 00:07:27,139
میدهیم بلهبلهبلهبلهبله و سپس سر نقطه DF را چاپ
185
00:07:27,139 –> 00:07:29,330
میکنیم و سپس با رفتن به
186
00:07:29,330 –> 00:07:30,950
این مورد اول را می بینیم که همان طور که
187
00:07:30,950 –> 00:07:32,870
می خواستیم و سپس دومی را دریافت می
188
00:07:32,870 –> 00:07:35,210
کنیم و بیشتر شبیه اتفاقی است که
189
00:07:35,210 –> 00:07:35,600
در اینجا رخ
190
00:07:35,600 –> 00:07:38,330
داده است ما شاخص خود را کاملاً از دست دادیم که
191
00:07:38,330 –> 00:07:41,120
واقعاً آزاردهنده است و این چیزی
192
00:07:41,120 –> 00:07:42,470
است که به صورت شما سیلی می زند.
193
00:07:42,470 –> 00:07:45,080
حداقل چند بار اما اتفاقی که در اینجا می
194
00:07:45,080 –> 00:07:48,139
افتد زمانی است که قاب داده را به این شکل تغییر می دهید،
195
00:07:48,139 –> 00:07:50,270
آنچه در اینجا اتفاق می افتد
196
00:07:50,270 –> 00:07: