در این مطلب، ویدئو چگونه با استفاده از پایتون درآمد فروش را پیش بینی کنیم؟ آموزش های کامل با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:40:47
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,240 –> 00:00:02,639
بیایید به پیشبینیهای فروش برویم، اوه من
2
00:00:02,639 –> 00:00:03,120
3
00:00:03,120 –> 00:00:05,839
مقداری کپی و پیست انجام خواهم داد، زیرا کمی بعد
4
00:00:05,839 –> 00:00:06,879
،
5
00:00:06,879 –> 00:00:08,559
چون قبلاً کد منبع را آماده
6
00:00:08,559 –> 00:00:10,080
کرده
7
00:00:10,080 –> 00:00:12,799
بودم، مراحل را طی
8
00:00:12,799 –> 00:00:14,000
میکنم تا توضیح دهم چگونه
9
00:00:14,000 –> 00:00:16,079
همه چیز را اجرا میکنید، بنابراین اجازه دهید کمی
10
00:00:16,079 –> 00:00:18,480
کپی کنم
11
00:00:18,480 –> 00:00:21,600
بنابراین اینگونه است که ما وارد می کنیم
12
00:00:21,600 –> 00:00:24,720
خوب ما کتابخانه ها را وارد می کنیم
13
00:00:24,720 –> 00:00:28,080
من امروز از ساده استفاده خواهم کرد
14
00:00:29,760 –> 00:00:32,080
بله
15
00:00:33,360 –> 00:00:36,640
با استفاده از این پانداهای بسیار ضعیف اگر
16
00:00:36,640 –> 00:00:37,440
17
00:00:37,440 –> 00:00:40,640
با چیزهای علم داده برخورد کردید با یک معامله بد
18
00:00:40,640 –> 00:00:41,680
19
00:00:41,680 –> 00:00:44,239
مواجه می شوید آیا از این موضوع برای سایر مبتدیان می
20
00:00:44,239 –> 00:00:44,879
دانید
21
00:00:44,879 –> 00:00:48,640
که numpy است کتابخانه ریاضی
22
00:00:48,640 –> 00:00:52,320
بله، ریاضیات به معنای
23
00:00:52,320 –> 00:00:56,239
مقادیر تجمعی تجمعی هستند
24
00:00:56,239 –> 00:00:58,879
و سپس الگوریتمهای نمایی زیادی وجود دارد
25
00:00:58,879 –> 00:01:01,120
26
00:01:01,120 –> 00:01:02,640
که
27
00:01:02,640 –> 00:01:04,159
در نرخ بهره ثانویه یاد گرفتیم،
28
00:01:04,159 –> 00:01:05,040
حداقل همه چیز در
29
00:01:05,040 –> 00:01:08,320
ماتریس خط است و اکنون
30
00:01:08,320 –> 00:01:10,560
پانداها هستند که این کار را انجام میدهند. ساخته شده در
31
00:01:10,560 –> 00:01:12,080
بالای numpy
32
00:01:12,080 –> 00:01:14,960
جایی که بهترین چیز برای numpy این است که شما
33
00:01:14,960 –> 00:01:16,799
می توانید
34
00:01:16,799 –> 00:01:19,680
داده های فرم جدول را وارد کنید، به عنوان مثال فایل اکسل
35
00:01:19,680 –> 00:01:21,439
فایل csv که می توانید
36
00:01:21,439 –> 00:01:25,920
با استفاده از پانداها در طول روز در روز به الگو وارد کنید.
37
00:01:25,920 –> 00:01:27,200
کتابخانه ای
38
00:01:27,200 –> 00:01:29,840
از python scalen این یک قاتل وضعیت است
39
00:01:29,840 –> 00:01:30,720
و
40
00:01:30,720 –> 00:01:34,400
یکی از بهترین ابزارها
41
00:01:34,400 –> 00:01:37,280
مخصوصا برای افرادی است که من همانقدر تنبل
42
00:01:37,280 –> 00:01:37,840
هستم
43
00:01:37,840 –> 00:01:39,920
که از عملکرد پاندا استفاده می کنم، می توانید
44
00:01:39,920 –> 00:01:42,960
پدال خود را برای دنبال کنندگان جستجو کنید،
45
00:01:43,200 –> 00:01:47,040
46
00:01:47,040 –> 00:01:49,840
بنابراین بعداً در تولید به شما نشان خواهم داد.
47
00:01:49,840 –> 00:01:50,320
48
00:01:50,320 –> 00:01:52,240
پانداهایی که اجرا می کنند اجازه دهید این یکی را
49
00:01:52,240 –> 00:01:53,439
برای شما
50
00:01:53,439 –> 00:01:56,399
دوستان به اشتراک بگذارم بسیار مفید است
51
00:01:56,560 –> 00:01:59,759
و باعث صرفه جویی در بسیاری از کارهای من می شود،
52
00:01:59,759 –> 00:02:04,320
بنابراین من اینگونه تمام csv ها را وارد می کنم
53
00:02:04,320 –> 00:02:05,280
54
00:02:05,280 –> 00:02:07,759
تا بتوانید ببینید که من داده های خود را
55
00:02:07,759 –> 00:02:09,199
در
56
00:02:09,199 –> 00:02:13,200
اینجا دارم. داده ها
57
00:02:13,200 –> 00:02:16,640
بله بیایید آنها را ببینیم داده های csv
58
00:02:16,640 –> 00:02:20,720
بنابراین دسترسی مایکروسافت بنابراین این فرم csv است
59
00:02:20,720 –> 00:02:22,560
و به هر حال این نوت بوک jupiter است
60
00:02:22,560 –> 00:02:24,879
من در داخل محلی خود اجرا می کنم این
61
00:02:24,879 –> 00:02:25,920
مرورگر من است
62
00:02:25,920 –> 00:02:27,840
بنابراین اگر آناکوندا را نصب کنید می
63
00:02:27,840 –> 00:02:28,959
توانید این
64
00:02:28,959 –> 00:02:32,080
نوت بوک uh را اجرا کنید بنابراین من دادهها را به این صورت
65
00:02:32,080 –> 00:02:34,959
وارد میکنم، بنابراین از پانداها استفاده میکنم و
66
00:02:34,959 –> 00:02:37,599
csv را میخوانم، باید مسیر
67
00:02:37,599 –> 00:02:38,560
فایل csv را ارائه دهم
68
00:02:38,560 –> 00:02:40,480
و من چهار فایل مختلف در
69
00:02:40,480 –> 00:02:43,120
اینجا دارم، بنابراین دستهبندی
70
00:02:43,120 –> 00:02:44,080
آیتمها را دارم،
71
00:02:44,080 –> 00:02:46,720
فروش کالا، دادههای آموزشی را آموزش میدهد و
72
00:02:46,720 –> 00:02:47,680
سپس مغازه ها
73
00:02:47,680 –> 00:02:51,440
پس بیایید ببینیم d چیست آتا که ما
74
00:02:51,440 –> 00:02:53,120
اینجا هستیم، داریم
75
00:02:53,120 –> 00:02:56,560
و اجازه دهید به
76
00:03:00,879 –> 00:03:03,519
آن ضربه بزنیم، پنج ردیف بالای مجموعه داده را به ما می دهد،
77
00:03:03,519 –> 00:03:04,560
78
00:03:04,560 –> 00:03:08,080
بنابراین این همان چیزی است که
79
00:03:08,080 –> 00:03:10,400
ما نام داده ها و سپس
80
00:03:10,400 –> 00:03:11,680
دسته
81
00:03:11,680 –> 00:03:14,560
و دسته بعدی را داریم
82
00:03:17,519 –> 00:03:20,640
، این موارد همان موارد هستند. من اقلامی دارم،
83
00:03:20,640 –> 00:03:21,280
84
00:03:21,280 –> 00:03:23,760
این شناسه مورد دسته و
85
00:03:23,760 –> 00:03:25,200
شناسه دسته است
86
00:03:25,200 –> 00:03:30,239
و سپس فروشگاهها داریم،
87
00:03:30,560 –> 00:03:33,360
بنابراین این یک نام کوتاه در شناسه فروشگاه است
88
00:03:33,360 –> 00:03:34,400
و آخرین
89
00:03:34,400 –> 00:03:38,480
مورد
90
00:03:39,440 –> 00:03:42,080
سیستم است،
91
00:03:45,440 –> 00:03:48,560
بنابراین از اینجا به اینجا
92
00:03:48,560 –> 00:03:51,599
تاریخ دارم تاریخ بلوک
93
00:03:51,599 –> 00:03:56,159
تاریخ را دارم بلوک بلوک میانی است
94
00:03:56,239 –> 00:03:59,200
و اوه نه این بلوک ماه است و سپس
95
00:03:59,200 –> 00:04:00,080
96
00:04:00,080 –> 00:04:04,799
این شناسه فروشگاه است و شناسه فروشگاه این شناسه است،
97
00:04:04,799 –> 00:04:07,840
بنابراین در بیشتر موارد
98
00:04:07,840 –> 00:04:10,879
وقتی پایگاه داده را در زمان مشاهده می
99
00:04:10,879 –> 00:04:13,120
کنیم جداول مختلفی داریم و سپس
100
00:04:13,120 –> 00:04:14,000
از کلید اصلی استفاده می کنیم.
101
00:04:14,000 –> 00:04:15,840
و کلید خارجی برای نگاشت
102
00:04:15,840 –> 00:04:18,478
داده ها، بنابراین بیشتر آنها از شناسه برای
103
00:04:18,478 –> 00:04:19,519
نگاشت داده ها استفاده می کنیم
104
00:04:19,519 –> 00:04:21,680
و سپس من شناسه مورد را دارم و سپس
105
00:04:21,680 –> 00:04:23,199
قیمت کالا
106
00:04:23,199 –> 00:04:26,320
و تعداد اقلام را
107
00:04:26,320 –> 00:04:29,360
برای هر روز در اینجا می فروشم، بنابراین
108
00:04:29,360 –> 00:04:32,960
این این است که چگونه دادهها را از خود csv نشان میدهیم،
109
00:04:32,960 –> 00:04:36,400
حالا چیز بعدی این است که میخواهم
110
00:04:36,400 –> 00:04:39,520
دادهها را ادغام کنم
111
00:04:39,520 –> 00:04:41,199
وقتی من آموزشهای یادگیری ماشینی را انجام میدهم و
112
00:04:41,199 –> 00:04:42,960
خرید زمان
113
00:04:42,960 –> 00:04:47,199
بر فروش من تأثیری نمیگذارد تا زمانی
114
00:04:47,199 –> 00:04:49,440
که محصولی که در مغازهام میفروشم
115
00:04:49,440 –> 00:04:50,639
خوب است و ارزان است،
116
00:04:50,639 –> 00:04:52,400
همه میآیند و مرا پیدا
117
00:04:52,400 –> 00:04:54,160
میکنند، بله واقعاً این
118
00:04:54,160 –> 00:04:57,280
رفتار انسانها است، بنابراین من از آن غفلت خواهم کرد.
119
00:04:57,280 –> 00:04:58,400
از اینجا خرید کنید
120
00:04:58,400 –> 00:05:00,720
و من علاقه مندم چیزی که از
121
00:05:00,720 –> 00:05:01,680
اینجا به آن علاقه دارم،
122
00:05:01,680 –> 00:05:04,800
دسته بندی اقلام است و سپس من اقلامی
123
00:05:04,800 –> 00:05:06,240
در اینجا
124
00:05:06,240 –> 00:05:09,680
دارم، اوه من بیشتر
125
00:05:09,680 –> 00:05:12,479
به دسته بندی اقلام در اینجا علاقه مند هستم
126
00:05:12,479 –> 00:05:13,280
127
00:05:13,280 –> 00:05:16,720
زیرا به نوعی به من
128
00:05:16,720 –> 00:05:18,960
کمک کرد تا همه چیز را تعمیم دهم اقلام
129
00:05:18,960 –> 00:05:20,080
چون به جای
130
00:05:20,080 –> 00:05:25,919
لایک فرض کنید اگر بروم می خواهم بخرم
131
00:05:26,000 –> 00:05:28,560
به شما مثال می زنم من می خواهم یک
132
00:05:28,560 –> 00:05:29,199
133
00:05:29,199 –> 00:05:32,960
پیراهن بخرم که خیلی
134
00:05:32,960 –> 00:05:37,919
نام تجاری است ما چه
135
00:05:37,919 –> 00:05:40,000
مارکی داریم مطمئنا jodano
136
00:05:40,000 –> 00:05:43,039
lb به همین دلیل تاکنون
137
00:05:43,039 –> 00:05:46,160
من من این مورد را ادامه نمی دهم و
138
00:05:46,160 –> 00:05:48,560
ما معمولا آنها را به یک دسته کلی گروه بندی می کنیم،
139
00:05:48,560 –> 00:05:50,080
بنابراین یک
140
00:05:50,080 –> 00:05:52,479
دسته بندی در اینجا داریم، بنابراین کاری که می
141
00:05:52,479 –> 00:05:53,840
خواهم انجام دهم این است که می خواهم
142
00:05:53,840 –> 00:05:55,919
داده های تجارت فروش خود را ادغام کنم، سپس می خواهم
143
00:05:55,919 –> 00:05:56,880
144
00:05:56,880 –> 00:06:07,840
دسته بندی کالا را داشته باشم می توانم استفاده
145
00:06:16,000 –> 00:06:21,360
کنم و سپس می خواهم با این یکی ادغام شوم
146
00:06:23,759 –> 00:06:27,120
و روی
147
00:06:27,120 –> 00:06:29,759
چون i شناسه مورد را در اینجا داشته باشید و
148
00:06:29,759 –> 00:06:31,120
سپس من
149
00:06:31,120 –> 00:06:34,880
شناسه مورد را در داخل df خود دارم، بنابراین من فقط از
150
00:06:34,880 –> 00:06:37,440
شناسه مورد
151
00:06:37,919 –> 00:06:43,039
استفاده می کنم و از نحوه عضویت استفاده می کنم،
152
00:06:45,680 –> 00:06:48,479
بنابراین اکنون می توانید ببینید که نام مورد را
153
00:06:48,479 –> 00:06:49,280
در اینجا
154
00:06:49,280 –> 00:06:51,840
دارم و سپس دسته بندی مورد را دارم و من
155
00:06:51,840 –> 00:06:53,520
این یکی را
156
00:06:53,520 –> 00:06:56,880
با شناسه مورد در اینجا تطبیق دهید، بنابراین به
157
00:06:56,880 –> 00:06:59,360
این صورت است که ما دو csv مختلف را ادغام می کنیم،
158
00:06:59,360 –> 00:07:00,560
می
159
00:07:00,560 –> 00:07:04,000
بینید که در پانداها
160
00:07:04,000 –> 00:07:06,319
با استفاده از الگوی بسیار ساده است اگر از شما
161
00:07:06,319 –> 00:07:07,199
بخواهم نقشه برداری را
162
00:07:07,199 –> 00:07:09,919
با استفاده از csv انجام دهید، شرط می بندم که برای انجام این کار کمی
163
00:07:09,919 –> 00:07:10,400
زمان
164
00:07:10,400 –> 00:07:12,400
می برد. من فقط باید
165
00:07:12,400 –> 00:07:14,080
یک کد اکنون داشته باشم، پس باید فشار می دادیم
166
00:07:14,080 –> 00:07:15,039
که در حال حاضر
167
00:07:15,039 –> 00:07:19,919
خوب است، حالا این پنج ردیف اول
168
00:07:19,919 –> 00:07:20,880
جدول من است
169
00:07:20,880 –> 00:07:23,440
و این مورد چیزی به من نمی
170
00:07:23,440 –> 00:07:26,800
دهد، بنابراین می خواهم آن را برداریم،
171
00:07:28,840 –> 00:07:31,840
اوه
172
00:07:33,039 –> 00:07:36,960
پس پاپ به من کمک می کند برای
173
00:07:36,960 –> 00:07:40,000
برداشتن آیتم ستون، بنابراین اگر
174
00:07:40,000 –> 00:07:43,440
دوباره پرینت گرفتم، میتوانید ببینید که
175
00:07:43,440 –> 00:07:47,440
آیتم از روی میزهای من رفته است،
176
00:07:47,440 –> 00:07:50,639
خوب است، بنابراین من بلوک را
177
00:07:50,639 –> 00:07:52,240
178
00:07:52,240 –> 00:07:55,280
اکنون اینجا قرار
179
00:07:55,280 –> 00:08:00,240
میدهم، اولین چیزی که میگویم کمی lazy right
180
00:08:03,199 –> 00:08:04,800
explode سپس لیست درست است و
181
00:08:04,800 –> 00:08:06,960
به طور معمول از گزارش نمایه استفاده خواهم کرد
182
00:08:06,960 –> 00:08:09,520
و این عملکرد aro است و این یکی
183
00:08:09,520 –> 00:08:11,280
مدتی طول می کشد
184
00:08:11,280 –> 00:08:13,919
تا پردازش انجام شود و پس از آن
185
00:08:13,919 –> 00:08:16,000
به طور مستقیم یک گزارش تجزیه و تحلیل داده بسیار زیبا به شما ارائه می دهد،
186
00:08:16,000 –> 00:08:19,120
187
00:08:19,120 –> 00:08:23,280
بنابراین شما واقعاً دوست
188
00:08:23,280 –> 00:08:26,160
ندارید برای انجام تجزیه و تحلیل خود و درک خود داده ها نیازی به مرور یک به یک داشته باشید
189
00:08:26,160 –> 00:08:27,039
190
00:08:27,039 –> 00:08:30,960
191
00:08:30,960 –> 00:08:33,759
.
192
00:08:34,799 –> 00:08:37,360
مدتی صبر کنید تا
193
00:08:37,360 –> 00:08:38,640
پردازش داده ها را انجام دهید
194
00:08:38,640 –> 00:08:40,000
و البته من در دستگاه های محلی خود کار می کنم، بسیار
195
00:08:40,000 –> 00:08:42,719
196
00:08:43,519 –> 00:08:45,200
خوب، اگر سؤالی دارید
197
00:08:45,200 –> 00:08:47,440
می توانید از من بپرسید
198
00:08:47,440 –> 00:08:49,839
بله، همانطور که من از پانداها
199
00:08:49,839 –> 00:08:51,760
برای خواندن داده ها از csv استفاده کردم
200
00:08:51,760 –> 00:08:55,519
و سپس من از پانداها برای ادغام
201
00:08:55,519 –> 00:08:58,880
دو داده csv مختلف در یک داده استفاده می
202
00:08:58,880 –> 00:09:01,920
کنم، ممکن است از من بپرسید ادموند اوه
203
00:09:01,920 –> 00:09:05,440
، من می توانم از صفحه گسترده csv یا اکسل
204
00:09:05,440 –> 00:09:07,279
برای ایجاد
205
00:09:07,279 –> 00:09:10,080
تجزیه و تحلیل خود استفاده کنم، می توانم نمودارها را در داخل ترسیم کنم بله،
206
00:09:10,080 –> 00:09:11,600
قطعاً می توانید این کار را انجام دهید،
207
00:09:11,600 –> 00:09:15,120
اما من یکی را به شما می گویم مسئله این است که
208
00:09:15,120 –> 00:09:18,720
اگر csv یا
209
00:09:18,720 –> 00:09:21,600
شتاب بیش از 10 مگابایت باشد، چه مدت
210
00:09:21,600 –> 00:09:23,360
باید منتظر بمانید تا باز شود
211
00:09:23,360 –> 00:09:25,360
و بعد یک بار که می خواهید محاسبه شارژ را انجام دهید
212
00:09:25,360 –> 00:09:26,880
و چه مدت باید منتظر بمانید
213
00:09:26,880 –> 00:09:27,519
214
00:09:27,519 –> 00:09:30,399
اما با استفاده از پانداها می توانم بخوانم
215
00:09:30,399 –> 00:09:31,279
یک فایل
216
00:09:31,279 –> 00:09:35,040
csv یا sr excel فایلی با 200 مگابایت
217
00:09:35,040 –> 00:09:37,279
در عرض چند ثانیه من می توانم
218
00:09:37,279 –> 00:09:39,120
داده ها را مستقیماً از آنجا بخوانم،
219
00:09:39,120 –> 00:09:42,640
بنابراین واقعاً به
220
00:09:42,640 –> 00:09:45,120
مجموعه داده بستگی دارد و سپس اگر
221
00:09:45,120 –> 00:09:47,519
مجموعه داده های بسیار بزرگی را پردازش
222
00:09:47,519 –> 00:09:49,839
می کنید، همیشه توصیه می کنم به
223
00:09:49,839 –> 00:09:51,519
پایتون و
224
00:09:51,519 –> 00:09:56,480
پاندا بروید تا تجزیه و تحلیل پایگاه داده خود را انجام دهید
225
00:09:59,200 –> 00:10:04,880
امیدواریم که
226
00:10:04,880 –> 00:10:08,079
227
00:10:08,079 –> 00:10:10,560
حذف کردن افت ستون را حذف کنید، بنابراین به طور
228
00:10:10,560 –> 00:10:12,240
معمول از pop استفاده می کنم زیرا اگر بخواهم این کار را انجام دهم اگر
229
00:10:12,240 –> 00:10:13,839
می خواهید آن را به عقب برگردانید، می توانم دوباره آن را
230
00:10:13,839 –> 00:10:19,839
درج کنم.
231
00:10:19,839 –> 00:10:21,519
چگونه سرمایه گذاری کنیم خوب ما تحت فشار هستیم
232
00:10:21,519 –> 00:10:24,480
که چگونه هر منطقه ای را بررسی کنیم اگر
233
00:10:24,480 –> 00:10:27,600
جایی است و چه زمانی باید عضویت را انجام دهیم
234
00:10:27,600 –> 00:10:30,800
آهه
235
00:10:30,800 –> 00:10:32,240
کجا کار را انجام دهیم زیرا می خواهم
236
00:10:32,240 –> 00:10:34,000
بپیوندم
237
00:10:34,000 –> 00:10:36,959
می خواهم دسته بندی مورد را در مجموعه داده های آموزشی خود
238
00:10:36,959 –> 00:10:39,120
دریافت کنم. از join استفاده کنید
239
00:10:39,120 –> 00:10:42,240
و چه زمانی میدانید که چگونه
240
00:10:42,240 –> 00:10:45,360
میدانید منطقه داده را بررسی کنید، این
241
00:10:45,360 –> 00:10:45,760
242
00:10:45,760 –> 00:10:49,839
خطا به طور معمول اتفاق
243
00:10:49,839 –> 00:10:53,360
میافتد، اگر تبلیغ میکنید، پس
244
00:10:59,440 –> 00:11:02,160
هی
245
00:11:02,800 –> 00:11:07,120
بیا به طور معمول،
246
00:11:07,120 –> 00:11:12,480
برخی از برخی از کارها را ارائه میدهی
247
00:11:12,480 –> 00:11:16,079
اوه جنگل های منطقه، بنابراین شما باید
248
00:11:16,079 –> 00:11:19,760
تحقیق کنید منطقه خود را از آنجا
249
00:11:24,079 –> 00:11:27,360
کشف کردم خوب، ما یک سوال از
250
00:11:27,360 –> 00:11:27,760
اینجا داریم
251
00:11:27,760 –> 00:11:29,600
که شما چه مشخصات لپ تاپی را به
252
00:11:29,600 –> 00:11:31,200
درست مانند این پنجره اپل توصیه
253
00:11:31,200 –> 00:11:34,160
می کنید.
254
00:11:34,160 –> 00:11:35,920
255
00:11:35,920 –> 00:11:39,200
256
00:11:39,200 –> 00:11:41,440
257
00:11:41,440 –> 00:11:42,640
توصیه می کنم به
258
00:11:42,640 –> 00:11:44,720
سراغ کتاب من بروید زیرا اپل بسیار
259
00:11:44,720 –> 00:11:46,640
گران است
260
00:11:46,640 –> 00:11:49,360
همه می دانند که احتمالاً
261
00:11:49,360 –> 00:11:50,160
اینطور است،
262
00:11:50,160 –> 00:11:53,120
اما یک چیز این است که یادداشتی که من اینجا گرفتم
263
00:11:53,120 –> 00:11:57,839
مربوط به سال 2015 است
264
00:12:02,160 –> 00:12:05,040
که من هنوز از آن استفاده می کنم، بنابراین می توانید ببینید چقدر
265
00:12:05,040 –> 00:12:06,160
برای
266
00:12:06,160 –> 00:12:09,200
گزارش من پایدار است، بنابراین بستگی دارد
267
00:12:09,200 –> 00:12:11,680
با فرض اینکه بتوانیم بر اصول
268
00:12:11,680 –> 00:12:13,040
اولیه استفاده از
269
00:12:13,040 –> 00:12:15,440
کتابخانه های پایتون مختلف برای ml مسلط باشیم، چه پروژه های نمونه ای هستند
270
00:12:15,440 –> 00:12:16,240
271
00:12:16,240 –> 00:12:19,279
که می توانیم انجام دهیم، من
272
00:12:19,279 –> 00:12:19,680
273
00:12:19,680 –> 00:12:22,720
برخی از موارد خوب را به شما نشان خواهم داد که این
274
00:12:22,720 –> 00:12:26,399
خیلی طول می کشد، اجازه دهید ابتدا این یکی را متوقف کنم،
275
00:12:31,519 –> 00:12:33,760
خب این خطا است. پیامی مبنی بر اینکه
276
00:12:33,760 –> 00:12:38,959
ما دریافت خواهیم کرد
277
00:12:38,959 –> 00:12:42,560
اوه خوب بیایید منتظر یکی دیگر باشیم
278
00:12:42,560 –> 00:12:46,480
اوه من بعداً یک وب سایت به شما نشان خواهم داد
279
00:12:46,480 –> 00:12:49,760
280
00:12:49,760 –> 00:12:52,800
که چه کارهایی می توانید انجام دهید تا
281
00:12:52,800 –> 00:12:55,040
بعداً می توانید از آنجا ادامه دهید و
282
00:12:55,040 –> 00:12:56,800
سپس سؤال دیگر این است که e
283
00:12:56,800 –> 00:12:57,360
284
00:12:57,360 –> 00:13:00,000
تابع زیرخط که در آن اگر
285
00:13:00,000 –> 00:13:00,959
به فریم دادهای که
286
00:13:00,959 –> 00:13:04,160
در حالت پاپ قرار میگیرد، نه را وارد کنید، زیرا من
287
00:13:04,160 –> 00:13:06,480
واقعاً نیازی به استفاده از نام مورد ندارم، به
288
00:13:06,480 –> 00:13:06,880
همین دلیل است که
289
00:13:06,880 –> 00:13:10,160
من فقط در زیر خط ذخیره
290
00:13:10,160 –> 00:13:13,519
کردم، بنابراین برای من مانند یک
291
00:13:13,519 –> 00:13:14,639
ابزار بی ارزش است و همه چیز را در داخل نشان میدهم.
292
00:13:14,639 –> 00:13:16,800
آن را زیر خط بکشید تا مثل اینکه برای
293
00:13:16,800 –> 00:13:18,240
من یک متغیر است
294
00:13:18,240 –> 00:13:21,360
اوه
295
00:13:21,360 –> 00:13:25,279
خوب آیا تجربه ای در مورد sns دارید
296
00:13:25,279 –> 00:13:27,040
که صادرات واردات گزارش مشابهی
297
00:13:27,040 –> 00:13:28,480
برای تجزیه و تحلیل داده ها دارند
298
00:13:28,480 –> 00:13:31,519
البته واقعاً مفید نیست ml uh pandas شما
299
00:13:31,519 –> 00:13:32,959
می توانید
300
00:13:32,959 –> 00:13:38,240
فایل sas uh sas
301
00:13:38,320 –> 00:13:41,360
ss را وارد کنید می توانید
302
00:13:41,360 –> 00:13:44,800
به خروجی داده ها در ss دسترسی داشته باشید،
303
00:13:44,800 –> 00:13:47,120
سپس می توانید از پانداها برای خواندن استفاده کنید، بنابراین هیچ مشکلی وجود ندارد
304
00:13:47,120 –> 00:13:49,839
305
00:13:50,079 –> 00:13:51,920
که بهتر از قبل نامیده می شود،
306
00:13:51,920 –> 00:13:53,440
307
00:13:53,440 –> 00:13:56,480
بستگی به هدف دارد، دلیل اینکه
308
00:13:56,480 –> 00:13:58,959
من از کالا استفاده می کنم این است که
309
00:13:58,959 –> 00:14:02,000
سریعتر اینجا می تواند
310
00:14:02,000 –> 00:14:05,519
توضیح دهد که چیست برای خط هفت بسیار استفاده می شود،
311
00:14:05,519 –> 00:14:08,720
این یکی، اوه اگر می بینید که
312
00:14:08,720 –> 00:14:12,560
این رشته df این جدولی است
313
00:14:12,560 –> 00:14:13,519
که من دارم
314
00:14:13,519 –> 00:14:17,040
و سپس این آیتم چارچوب داده
315
00:14:17,040 –> 00:14:18,160
برای آیتم هایی است
316
00:14:18,160 –> 00:14:21,680
که من این یکی را با این یکی ادغام می
317
00:14:21,680 –> 00:14:24,399
کنم اما از سمت چپ استفاده می کنم پیوستن به است از
318
00:14:24,399 –> 00:14:25,519
این پایه استفاده کنید
319
00:14:25,519 –> 00:14:28,160
و سپس میخواهم از آن بهعنوان پایه خود استفاده کنم
320
00:14:28,160 –> 00:14:30,000
و دادهها
321
00:14:30,000 –> 00:14:33,120
بر اساس شناسه مورد از این یکی به این یکی ادغام میشوند
322
00:14:33,120 –> 00:14:33,760
323
00:14:33,760 –> 00:14:37,360
و سپس این نتیجه من است که
324
00:14:39,199 –> 00:14:40,880
این منبع میتواند در اسلایدها
325
00:14:40,880 –> 00:14:42,720
باشد و منبع آن نباشد. در داخل استرس،
326
00:14:42,720 –> 00:14:44,000
اما
327
00:14:44,000 –> 00:14:46,399
اگر تا آخر بمانید، کد منبع در اختیار شما قرار خواهد گرفت،
328
00:14:46,399 –> 00:14:48,639
329
00:14:53,440 –> 00:14:55,360
آه، در حالی که منتظر آن هستید، فقط
330
00:14:55,360 –> 00:14:56,720
331
00:14:56,720 –> 00:14:58,320
پس از آماده شدن، ابتدا تعدادی رکورد را مرور می کنیم، سپس می توانید
332
00:14:58,320 –> 00:15:00,560
ببینید
333
00:15:00,959 –> 00:15:04,160
خوب این یکی
334
00:15:04,160 –> 00:15:08,000
از عملکردهاست. که من
335
00:15:08,000 –> 00:15:10,839
کم و بیش برای حذف
336
00:15:10,839 –> 00:15:12,320
داده های تکراری
337
00:15:12,320 –> 00:15:16,399
از سایت خود ایجاد کردم این تابعی است
338
00:15:16,399 –> 00:15:19,120
که به طور معمول توابع زیادی را
339
00:15:19,120 –> 00:15:21,440
340
00:15:21,440 –> 00:15:24,800
در برنامه نویسی خود یا کتابخانه های خود در
341
00:15:24,800 –> 00:15:26,320
کتابخانه های خود ایجاد خواهم کرد.
342
00:15:26,320 –> 00:15:27,760
انواع
343
00:15:27,760 –> 00:15:29,120
344
00:15:29,120 –> 00:15:32,320
کتابخانههای خارجی مانند firebase google
345
00:15:32,320 –> 00:15:33,440
cloud platform
346
00:15:33,440 –> 00:15:35,360
bigquery و انواع کتابخانهها
347
00:15:35,360 –> 00:15:37,120
، من کل کتابخانههایم را برای
348
00:15:37,120 –> 00:15:39,120
استفاده از آنها نوشتم، بنابراین اغلب اوقات
349
00:15:39,120 –> 00:15:40,240
350
00:15:40,240 –> 00:15:43,519
کپی پیست زیادی انجام میدهم، پس واقعاً نیازی به
351
00:15:43,519 –> 00:15:45,120
نوشتن دوباره
352
00:15:45,120 –> 00:15:48,720
برای انجام این کار ندارم. همان وظیفه به
353
00:15:48,720 –> 00:15:50,639
تمام کدهایی که به عنوان
354
00:15:50,639 –> 00:15:52,320
کتابخانه نوشتهام توجه کنید، در طول کلاسها به شما بچهها نیز منتقل میکنم
355
00:15:52,320 –> 00:15:54,000
، بنابراین
356
00:15:54,000 –> 00:15:55,680
در بیشتر وقت خود صرفهجویی میکنید و از مرور
357
00:15:55,680 –> 00:15:58,240
358
00:15:58,240 –> 00:16:01,279
سایر اسناد صرفهجویی میکنید.
359
00:16:01,279 –> 00:16:02,560
360
00:16:02,560 –> 00:16:05,360
خوب
361
00:16:05,360 –> 00:16:08,800
نحوه آموزش قالب متن داده های آشفته
362
00:16:08,800 –> 00:16:12,240
بهترین چیزی که من تا به حال از آن استفاده کرده ام
363
00:16:12,240 –> 00:16:15,440
عبارات منظم regex است اگر
364
00:16:15,440 –> 00:16:16,560
آشنا
365
00:16:16,560 –> 00:16:20,959
نیستید می توانید عبارات منظم را جستجو کنید
366
00:16:20,959 –> 00:16:24,800
اگرچه ما آنها را به عنوان قطعه می نامیم
367
00:16:24,800 –> 00:16:27,279
368
00:16:28,320 –> 00:16:32,800
خوب حالا چیز بعدی
369
00:16:32,800 –> 00:16:37,839
مشکلی ندارد پس این یکی
370
00:16:38,399 –> 00:16:40,639
پس این یکی من است
371
00:16:40,639 –> 00:16:43,199
میخواهم زیرمجموعهای را ایجاد کنم، میخواهم دادهها را بیرون بیاورم و
372
00:16:43,199 –> 00:16:44,560
میخواهم
373
00:16:44,560 –> 00:16:47,279
دادههای تکراری را حذف کنم، بنابراین وقتی این یکی را اجرا کردم، اگر
374
00:16:47,279 –> 00:16:48,480
مقداری از
375
00:16:48,480 –> 00:16:51,519
آنچه را که تمام شده است چاپ کنید، چاپ میشود و اگر طول آن را چاپ
376
00:16:51,519 –> 00:16:53,199
کنید، چاپ میشود.
377
00:16:53,199 –> 00:16:56,720
رها کنید و
378
00:16:56,720 –> 00:16:59,680
مجموع دادههای تکثیری که
379
00:16:59,680 –> 00:17:03,120
من داخل قاب دادهام دارم
380
00:17:03,120 –> 00:17:05,599
چقدر است، خوب، پس این یک چیز است و هنوز به یاد داشته باشید
381
00:17:05,599 –> 00:17:07,039
که من اشاره کردم که
382
00:17:07,039 –> 00:17:11,599
دسته دیگر را اینجا میخواهم،
383
00:17:11,599 –> 00:17:13,439
دستههای زیادی در اینجا
384
00:17:13,439 –> 00:17:16,959
دارم مانند af کوچک
385
00:17:16,959 –> 00:17:19,679
پس از اتمام این باند 71، در نهایت پس از اتمام این باند،
386
00:17:19,679 –> 00:17:21,039
387
00:17:21,039 –> 00:17:25,280
دادههای دستهبندی را به شما نشان خواهم داد،
388
00:17:25,280 –> 00:17:27,839
اما مطمئناً از آنجایی که ما دادههای دستهبندی زیادی داریم
389
00:17:27,839 –> 00:17:29,039
390
00:17:29,039 –> 00:17:31,520
و بیشتر اوقات میخواهم از دستهبندی بیش از حد اجتناب کنم
391
00:17:31,520 –> 00:17:33,120
392
00:17:33,120 –> 00:17:37,200
یا مقدار زیادی از اوه
393
00:17:38,320 –> 00:17:40,080
وجود دارد دسته بندی بیش از حد به ما
394
00:17:40,080 –> 00:17:42,000
نویزهای زیادی می دهد،
395
00:17:42,000 –> 00:17:44,080
بنابراین کاری که می خواهم انجام دهم این است که می خواهم
396
00:17:44,080 –> 00:17:45,520
آن را به
397
00:17:45,520 –> 00:17:48,799
گروه های کوچکتر کوچکتر کاهش دهم تا بتوانم
398
00:17:48,799 –> 00:17:51,919
از این یک کپی
399
00:17:51,919 –> 00:17:55,440
پیست استفاده کنم، بنابراین می توانید
400
00:17:55,440 –> 00:17:58,320
یک و هشت را در اینجا ببینید 10 تا 18 18 تا
401
00:17:58,320 –> 00:17:59,200
25
402
00:17:59,200 –> 00:18:01,600
اینها شناسه موردی هستند که من از
403
00:18:01,600 –> 00:18:03,280
طریق csv
404
00:18:03,280 –> 00:18:05,679
که می توانم دریافت کنم نام آن را
405
00:18:05,679 –> 00:18:06,880
برای دسترسی به
406
00:18:06,880 –> 00:18:09,600
کنسول کنسول بازی های غذایی بازی های سی دی
407
00:18:09,600 –> 00:18:10,320
بازی کارت
408
00:18:10,320 –> 00:18:13,520
فیلم کتاب هدیه و اسباب بازی های نرم تغییر دادم و
409
00:18:13,520 –> 00:18:15,840
آنها را در داخل ذخیره کردم. من
410
00:18:15,840 –> 00:18:18,799
در داخل یک
411
00:18:19,120 –> 00:18:22,220
ستون جدید از قاب داده من
412
00:18:22,220 –> 00:18:23,679
[Music]
413
00:18:23,679 –> 00:18:27,520
هنوز 25 مورد دیگر برای اجرا وجود دارد،
414
00:18:27,520 –> 00:18:30,640
بنابراین این برای تعیین نام
415
00:18:30,640 –> 00:18:34,320
برای دسته است و از
416
00:18:34,320 –> 00:18:37,280
شناسه مورد از یک تا هشت، همه آنها
417
00:18:37,280 –> 00:18:38,880
به
418
00:18:38,880 –> 00:18:42,880
نام uh و سپس 10 به دسترسی خواهند داشت. 18 ما
419
00:18:42,880 –> 00:18:45,440
کنسول 18 تا 25 بازی کنسول داریم،
420
00:18:45,440 –> 00:18:48,400
بنابراین از اینجا به ادامه مطلب می پردازم
421
00:18:48,400 –> 00:18:49,360
موارد را
422
00:18:49,360 –> 00:18:52,000
در دستههای کوچکتر خلاصه میکنم و سپس آن
423
00:18:52,000 –> 00:18:52,960
را در قسمت
424
00:18:52,960 –> 00:18:56,720
ثبت قاب دادهام ذخیره میکنم
425
00:19:09,380 –> 00:19:12,589
[Music]
426
00:19:15,120 –> 00:19:20,480
بعد از آن
427
00:19:20,480 –> 00:19:23,039
این یکی است، بنابراین این چیزی است که
428
00:19:23,039 –> 00:19:24,000
من انجام میدهم، میخواهم
429
00:19:24,000 –> 00:19:27,280
زیرا اوه این جدول
430
00:19:27,280 –> 00:19:30,400
هنوز این جدول را به خاطر میآورد.
431
00:19:30,400 –> 00:19:31,200
جدول را درست تبدیل کنید
432
00:19:31,200 –> 00:19:33,919
تا این تاریخ داده ها را در اینجا ببینید
433
00:19:33,919 –> 00:19:34,320
434
00:19:34,320 –> 00:19:36,880
این یک تاریخ رشته ای است، بنابراین منظور من از
435
00:19:36,880 –> 00:19:38,880
رشته این است که یک متن
436
00:19:38,880 –> 00:19:41,919
است تا بتوانیم یک و یک
437
00:19:41,919 –> 00:19:45,360
سال از این
438
00:19:45,360 –> 00:19:47,840
متن را که باید تبدیل کنیم استخراج کنیم. آن را به یک
439
00:19:47,840 –> 00:19:49,120
440
00:19:49,120 –> 00:19:52,480
فرمت datetime uh time
441
00:19:52,480 –> 00:19:55,919
بنابراین این کد
442
00:19:55,919 –> 00:19:58,400
به تاریخ زمان است برای تبدیل آن ستون
443
00:19:58,400 –> 00:20:00,000
به یک مجموعه داده تاریخ
444
00:20:00,000 –> 00:20:03,200
و سپس داده ها را با
445
00:20:03,200 –> 00:20:04,159
خود تاریخ جایگزین
446
00:20:04,159 –> 00:20:06,240
می کنم تا تبدیل شود و سپس
447
00:20:06,240 –> 00:20:07,360
باید
448
00:20:07,360