در این مطلب، ویدئو آموزش پانداها Crosstab | آموزش پاندای پایتون شماره 7 | Aggfunc، Margins، Normalize Data با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:12:30
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,080 –> 00:00:01,920
در این ویدیو همه چیز را در مورد
2
00:00:01,920 –> 00:00:03,600
عملکرد تداخل پانداها
3
00:00:03,600 –> 00:00:05,120
و نحوه استفاده از آن برای
4
00:00:05,120 –> 00:00:06,799
خلاصه کردن سریع و آسان داده های خود یاد خواهید گرفت،
5
00:00:06,799 –> 00:00:09,050
اجازه دهید
6
00:00:09,050 –> 00:00:11,679
[Music] را شروع
7
00:00:11,679 –> 00:00:13,280
کنیم اگر در این سری تازه کار هستید،
8
00:00:13,280 –> 00:00:14,880
حتما ویدیوهای دیگر را ببینید. در این
9
00:00:14,880 –> 00:00:16,079
سری پانداهای مبتدی
10
00:00:16,079 –> 00:00:17,920
که من همینجا به آن پیوند خواهم داد،
11
00:00:17,920 –> 00:00:19,840
تابع متقاطع پانداها کاملاً
12
00:00:19,840 –> 00:00:21,680
شبیه تابع جدول محوری پاندا است
13
00:00:21,680 –> 00:00:23,199
که در آموزش دیگری به
14
00:00:23,199 –> 00:00:24,960
آن پرداخته ام که می توانید با
15
00:00:24,960 –> 00:00:26,640
کلیک کردن روی پیوند در
16
00:00:26,640 –> 00:00:28,160
اینجا نیز پیدا کنید. تعداد
17
00:00:28,160 –> 00:00:30,080
تفاوت های کلیدی اولین مورد این است
18
00:00:30,080 –> 00:00:32,238
که به شما امکان می دهد
19
00:00:32,238 –> 00:00:34,160
داده های خود را به راحتی نرمال کنید تا داده های خود را به
20
00:00:34,160 –> 00:00:37,200
عنوان یک ستون ردیف یا درصد کل نشان دهید به
21
00:00:37,200 –> 00:00:39,600
طور پیش فرض همچنین از تابع شمارش
22
00:00:39,600 –> 00:00:40,320
23
00:00:40,320 –> 00:00:42,719
به جای تابع میانگین استفاده می کند. آخرین
24
00:00:42,719 –> 00:00:44,399
تفاوت کلید این است که این کار را انجام نمی دهد. در ابتدا
25
00:00:44,399 –> 00:00:46,000
لازم نیست که دادههای شما
26
00:00:46,000 –> 00:00:48,160
در یک قاب داده باشد، شما میتوانید
27
00:00:48,160 –> 00:00:49,280
به صورت
28
00:00:49,280 –> 00:00:51,440
سری مانند اشیاء را به ردیفها و
29
00:00:51,440 –> 00:00:52,879
ستونها
30
00:00:52,879 –> 00:00:54,960
منتقل کنید.
31
00:00:54,960 –> 00:00:56,239
32
00:00:56,239 –> 00:00:59,440
پانداها را در اینجا به صورت pdf مرتب کرده
33
00:00:59,440 –> 00:01:01,760
و در یک مجموعه داده از این
34
00:01:01,760 –> 00:01:03,680
آموزش در اینجا بخوانید که در زیر به آن لینک میدهم
35
00:01:03,680 –> 00:01:04,640
36
00:01:04,640 –> 00:01:06,479
و آرگومان parse dates را اضافه
37
00:01:06,479 –> 00:01:08,320
میکنم تا مطمئن شوم که همه تاریخهای ما بهطور
38
00:01:08,320 –> 00:01:11,280
صحیح بهعنوان تاریخ خوانده میشوند نه رشتهها.
39
00:01:11,280 –> 00:01:13,040
به یک
40
00:01:13,040 –> 00:01:14,640
قاب داده به نام df اختصاص داده شده است،
41
00:01:14,640 –> 00:01:16,799
بیایید نگاهی به شکل واقعی df بیندازیم
42
00:01:16,799 –> 00:01:19,040
که میتوانیم
43
00:01:19,040 –> 00:01:22,560
سر نقطه df
44
00:01:22,720 –> 00:01:24,080
بنویسیم، در اینجا میتوانیم ببینیم که یک ستون تاریخ داریم
45
00:01:24,080 –> 00:01:26,799
که نشاندهنده تاریخ است،
46
00:01:26,799 –> 00:01:28,560
یک ستون منطقه که
47
00:01:28,560 –> 00:01:30,320
منطقه یک
48
00:01:30,320 –> 00:01:32,400
نوع تراکنش را نشان میدهد. نوع
49
00:01:32,400 –> 00:01:34,079
لباس فروخته شده
50
00:01:34,079 –> 00:01:36,320
واحدها که تعداد واحدهای فروخته شده است
51
00:01:36,320 –> 00:01:37,280
و در نهایت
52
00:01:37,280 –> 00:01:39,280
فروش که نشان دهنده کل
53
00:01:39,280 –> 00:01:43,200
قیمت فروش آن معامله است،
54
00:01:43,200 –> 00:01:45,840
بنابراین عملکرد پانداهای متقاطع
55
00:01:45,840 –> 00:01:47,600
کاملاً شبیه به
56
00:01:47,600 –> 00:01:49,360
عملکرد جدول محوری پانداها عمل می کند، اما قبل از ما
57
00:01:49,360 –> 00:01:51,360
تعدادی تفاوت کلیدی وجود دارد.
58
00:01:51,360 –> 00:01:52,720
برخی از این
59
00:01:52,720 –> 00:01:54,960
تفاوتها را بررسی کنید، اجازه دهید در واقع اولین زبانه متقاطع خود را ایجاد کنیم،
60
00:01:54,960 –> 00:01:56,240
61
00:01:56,240 –> 00:01:59,040
بنابراین برای انجام این کار، میتوانیم برگه متقاطع نقطهای ps بنویسیم،
62
00:01:59,040 –> 00:02:00,079
63
00:02:00,079 –> 00:02:02,159
کاری که باید انجام دهیم این است که هم در یک
64
00:02:02,159 –> 00:02:03,520
نمایه و هم یک ستون
65
00:02:03,520 –> 00:02:05,200
posi ارسال کنیم. به طور کلی index قرار است
66
00:02:05,200 –> 00:02:08,479
اولین آرگومان باشد، بنابراین ما فقط می توانیم df را بنویسیم
67
00:02:08,479 –> 00:02:10,479
و سپس هر ستونی را که می خواهیم به
68
00:02:10,479 –> 00:02:11,599
عنوان شاخص خود استفاده کنیم،
69
00:02:11,599 –> 00:02:13,920
بنابراین منطقه را برای این مثال
70
00:02:13,920 –> 00:02:14,720
می نویسیم، سپس می توانیم
71
00:02:14,720 –> 00:02:17,760
72
00:02:17,760 –> 00:02:19,680
اکنون وقتی این را اجرا می کنیم، نوع نقطه df را برای ستون های خود بنویسیم. می بینیم که
73
00:02:19,680 –> 00:02:21,599
crosstab به طور خودکار ایجاد شده است
74
00:02:21,599 –> 00:02:22,400
،
75
00:02:22,400 –> 00:02:24,400
این ما را به اولین تفاوت
76
00:02:24,400 –> 00:02:27,360
بین صفحات متقاطع پانداها و جداول محوری داده پانداها نشان می دهد،
77
00:02:27,360 –> 00:02:30,480
کاری که crosstab
78
00:02:30,480 –> 00:02:33,120
به طور پیش فرض انجام می دهد این است که تعداد دفعات ایجاد می کند،
79
00:02:33,120 –> 00:02:33,680
80
00:02:33,680 –> 00:02:35,680
بنابراین همه اینها تعداد
81
00:02:35,680 –> 00:02:37,040
دفعاتی را
82
00:02:37,040 –> 00:02:39,599
نشان می دهد که هر یک از آنها نشان می دهد. در مجموعه داده های اصلی،
83
00:02:39,599 –> 00:02:40,400
در حالی
84
00:02:40,400 –> 00:02:42,160
که جدول محوری توسط تابع،
85
00:02:42,160 –> 00:02:44,160
مقدار میانگین را برمی گرداند،
86
00:02:44,160 –> 00:02:45,920
این در اینجا دقیقاً همان
87
00:02:45,920 –> 00:02:48,160
چیزی است که اگر
88
00:02:48,160 –> 00:02:51,840
نمایه را برابر و
89
00:02:51,840 –> 00:02:55,040
ستون ها را برابر می نوشتیم،
90
00:02:55,200 –> 00:02:56,959
بنابراین وقتی این را اجرا می کنیم می توانیم ببینیم که
91
00:02:56,959 –> 00:02:59,040
در واقع دقیقاً یکسان است. نتیجه
92
00:02:59,040 –> 00:03:01,760
اکنون چه می شود اگر نمی خواهید
93
00:03:01,760 –> 00:03:04,000
جداول فرکانس را با زبانه متقاطع خود محاسبه
94
00:03:04,000 –> 00:03:06,400
کنید، همچنین می توانید هر
95
00:03:06,400 –> 00:03:07,840
تابع متفاوتی را که می خواهید مشابه جدول محوری استفاده کنید، اعمال کنید
96
00:03:07,840 –> 00:03:10,560
. xample
97
00:03:10,560 –> 00:03:12,720
اگر می خواهید میانگین
98
00:03:12,720 –> 00:03:16,640
ارزش هر کالای فروش متعلق
99
00:03:16,640 –> 00:03:18,640
به مناطق و انواع لباس های مختلف را محاسبه
100
00:03:18,640 –> 00:03:20,560
کنید، می توانید
101
00:03:20,560 –> 00:03:23,879
pd cross tab و سپس دوباره
102
00:03:23,879 –> 00:03:28,720
df.region df.type را برای ستون ها بنویسید
103
00:03:28,720 –> 00:03:31,440
و اکنون در فیلد مقادیر می نویسیم
104
00:03:31,440 –> 00:03:32,480
مقادیر
105
00:03:32,480 –> 00:03:35,200
به پانداها میگویند که از کدام ستون بهعنوان
106
00:03:35,200 –> 00:03:37,920
مقادیر برای تجمیع مختلف شما استفاده کنند،
107
00:03:37,920 –> 00:03:41,040
بنابراین در این مورد ما میخواهیم
108
00:03:41,040 –> 00:03:43,200
فروش نقطهای df را بنویسیم زیرا به فروش علاقهمندیم
109
00:03:43,200 –> 00:03:44,239
110
00:03:44,239 –> 00:03:46,640
و سپس یک ag funk که مخفف تجمع است ارسال میکنیم.
111
00:03:46,640 –> 00:03:48,400
112
00:03:48,400 –> 00:03:51,599
و
113
00:03:51,599 –> 00:03:54,159
اکنون وقتی این را اجرا می کنیم، میانگین را می نویسیم، مقادیر
114
00:03:54,159 –> 00:03:56,080
از یک جدول فرکانس ساده جایگزین شده اند
115
00:03:56,080 –> 00:03:57,760
تا در واقع
116
00:03:57,760 –> 00:04:00,879
مقدار میانگین فروش را بر اساس نوع
117
00:04:00,879 –> 00:04:02,640
و منطقه نشان دهند
118
00:04:02,640 –> 00:04:04,239
که می توانید با این
119
00:04:04,239 –> 00:04:06,159
پارامتر تابع تجمیع به
120
00:04:06,159 –> 00:04:07,280
همان اندازه بازی کنید. شما می خواهید
121
00:04:07,280 –> 00:04:09,200
به طور مشابه اگر می خواهید
122
00:04:09,200 –> 00:04:11,200
مجموع کل فروش را چاپ
123
00:04:11,200 –> 00:04:13,519
کنید، می توانید جمع را بنویسید و
124
00:04:13,519 –> 00:04:15,360
به مجموع فروش در اینجا تغییر می کند،
125
00:04:15,360 –> 00:04:17,918
حالا اجازه دهید به برگه متقاطع اصلی خود
126
00:04:17,918 –> 00:04:18,880
بازگردیم،
127
00:04:18,880 –> 00:04:21,279
من آن را اینجا کپی می کنم و
128
00:04:21,279 –> 00:04:22,720
دوباره اجرا می کنم
129
00:04:22,720 –> 00:04:25,440
ما می توانیم s در اینجا که نوع کلمه و
130
00:04:25,440 –> 00:04:26,720
منطقه اعمال شده است،
131
00:04:26,720 –> 00:04:28,960
اما بگویید میخواهید کمی
132
00:04:28,960 –> 00:04:31,199
مشخصتر یا واضحتر باشد و برای برچسبگذاری
133
00:04:31,199 –> 00:04:32,880
سطرها و ستونهای
134
00:04:32,880 –> 00:04:35,840
خود، در واقع میتوانید فهرستی
135
00:04:35,840 –> 00:04:38,080
از نامها را برای سطرها و
136
00:04:38,080 –> 00:04:38,800
ستونها ارسال کنید.
137
00:04:38,800 –> 00:04:41,520
بنابراین اگر میخواهیم ردیفها را تغییر نام دهیم، چه کاری میتوانیم انجام دهیم، میتوانیم
138
00:04:41,520 –> 00:04:42,400
139
00:04:42,400 –> 00:04:45,680
از نام ردیفها برابر استفاده کنیم و سپس
140
00:04:45,680 –> 00:04:46,080
141
00:04:46,080 –> 00:04:49,280
آنچه را که میخواهیم آن را
142
00:04:49,440 –> 00:04:52,800
منطقه فروش بنامیم، به عنوان مثال و
143
00:04:52,800 –> 00:04:53,199
با
144
00:04:53,199 –> 00:04:55,759
نام ستونها با استفاده از نامهای تماس، جایی که
145
00:04:55,759 –> 00:04:58,240
میتوانیم نوع لباس را بنویسیم، ارسال کنیم.
146
00:04:58,400 –> 00:05:01,759
ما دوباره این را اجرا
147
00:05:01,759 –> 00:05:02,479
148
00:05:02,479 –> 00:05:05,199
می کنیم و می بینیم که سرصفحه های ستون و
149
00:05:05,199 –> 00:05:06,960
سطر با چیزی
150
00:05:06,960 –> 00:05:07,680
که از آن عبور می کنیم جایگزین شده اند
151
00:05:07,680 –> 00:05:10,720
یکی دیگر از ویژگی های بسیار مفید این
152
00:05:10,720 –> 00:05:12,400
است که شما می توانید در
153
00:05:12,400 –> 00:05:15,440
یک چند لایه از شاخص ها عبور کنید و همچنین بگویید می خواهید
154
00:05:15,440 –> 00:05:17,520
تجزیه کنید. دادههای شما برحسب
155
00:05:17,520 –> 00:05:19,520
منطقه و ربع زمانی که
156
00:05:19,520 –> 00:05:21,280
تراکنش انجام شد،
157
00:05:21,280 –> 00:05:23,120
اکنون میتوانیم این کار را با
158
00:05:23,120 –> 00:05:25,360
گذراندن چند شاخص انجام
159
00:05:25,360 –> 00:05:27,520
دهیم تا بتوانیم یک چهارم پانداها را به دست آوریم که
160
00:05:27,520 –> 00:05:30,000
میتوانید از یک دسترسی به زمان تاریخ استفاده کنید، به
161
00:05:30,000 –> 00:05:32,639
این معنی که شما
162
00:05:32,639 –> 00:05:34,960
به سادگی عبور کنید اگر
163
00:05:34,960 –> 00:05:37,600
دادههای خود را بهدرستی بهعنوان یک تاریخ قالببندی کردهاید، میتوانید
164
00:05:37,600 –> 00:05:39,680
نوع تابع تجمعی را
165
00:05:39,680 –> 00:05:41,280
که میخواهید استفاده کنید ارسال کنید،
166
00:05:41,280 –> 00:05:43,840
بنابراین برای انجام این کار، اجازه دهید به سرعت
167
00:05:43,840 –> 00:05:45,039
کارهایی را که میخواهیم انجام
168
00:05:45,039 –> 00:05:46,880
دهیم هنگام چاپ
169
00:05:46,880 –> 00:05:48,960
قاب داده اصلیمان انجام دهیم، میتوانیم اینجا ببینیم.
170
00:05:48,960 –> 00:05:51,520
که این یک تاریخ خاص است، اکنون
171
00:05:51,520 –> 00:05:53,919
میخواهیم به سه ماههای نگاه
172
00:05:53,919 –> 00:05:55,840
کنیم که با هر یک از
173
00:05:55,840 –> 00:05:57,919
تاریخهای مختلف نشان داده میشود، شما میتوانید تاریخ
174
00:05:57,919 –> 00:05:59,680
df
175
00:05:59,680 –> 00:06:03,120
را بنویسید و سپس در نقطه dt برای زمان تاریخ
176
00:06:03,120 –> 00:06:04,639
177
00:06:04,639 –> 00:06:07,680
و سه ماهه کاری که قرار است انجام شود، ار