در این مطلب، ویدئو پروژه نمونه کارها تحلیلگر داده | همبستگی در پایتون | پروژه 4/4 با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 1:00:44
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,080 –> 00:00:01,599
چه خبر است همه خوش آمدید
2
00:00:01,599 –> 00:00:03,679
امروز به ویدیوی دیگری بازگردید،
3
00:00:03,679 –> 00:00:05,279
ما در حال ادامه سری پروژه نمونه کارها تحلیلگر داده خود
4
00:00:05,279 –> 00:00:09,359
با چهارمین پروژه خود در پایتون
5
00:00:09,740 –> 00:00:12,900
[موسیقی] هستیم،
6
00:00:13,519 –> 00:00:15,519
اکنون من در مورد این پروژه بسیار هیجان زده هستم
7
00:00:15,519 –> 00:00:17,199
زیرا این اولین
8
00:00:17,199 –> 00:00:18,800
پروژه نمونه کار است که ما در حال انجام آن هستیم.
9
00:00:18,800 –> 00:00:20,160
python و ما از
10
00:00:20,160 –> 00:00:22,880
بسیاری از کتابخانه های محبوب مانند پانداهای
11
00:00:22,880 –> 00:00:24,640
دریایی و matplotlib استفاده خواهیم کرد،
12
00:00:24,640 –> 00:00:26,720
اگر تا به حال از پایتون استفاده نکرده اید،
13
00:00:26,720 –> 00:00:28,240
این پروژه ممکن
14
00:00:28,240 –> 00:00:29,279
است برای شما کمی سخت باشد
15
00:00:29,279 –> 00:00:30,880
، انتظار دارم
16
00:00:30,880 –> 00:00:33,200
حداقل اصول اولیه پایتون و پایتون را بدانید. من در برخی از زمینه ها
17
00:00:33,200 –> 00:00:34,640
کمی بالاتر و فراتر از آن
18
00:00:34,640 –> 00:00:36,160
19
00:00:36,160 –> 00:00:38,079
می روم اما مفاهیم دشوارتر را توضیح می دهم در حالی که
20
00:00:38,079 –> 00:00:39,680
قصد ندارم توضیح دهم که آرایه یا حلقه for
21
00:00:39,680 –> 00:00:41,440
چیست زیرا انتظار
22
00:00:41,440 –> 00:00:42,000
دارم بدانید که
23
00:00:42,000 –> 00:00:43,360
من سعی کردم برای اینکه تا حد ممکن بتوانم این را برای مبتدیان
24
00:00:43,360 –> 00:00:45,280
دوستانه کنم، اما من می
25
00:00:45,280 –> 00:00:46,719
گویم که فکر می کنم این یکی از
26
00:00:46,719 –> 00:00:48,160
پروژه های فنی تر است که ما تا به حال روی آن کار کرده ایم،
27
00:00:48,160 –> 00:00:48,960
28
00:00:48,960 –> 00:00:50,640
با این گفته که بیایید از
29
00:00:50,640 –> 00:00:52,320
روی صفحه نمایش من بپریم، ما می خواهیم t را دانلود کنیم. مجموعه دادههای
30
00:00:52,320 –> 00:00:53,920
ما میخواهیم python ایده خود را نصب کنیم،
31
00:00:53,920 –> 00:00:55,600
میخواهیم کل
32
00:00:55,600 –> 00:00:56,079
پروژه
33
00:00:56,079 –> 00:00:58,079
آن را در github آپلود کنیم، بنابراین بیایید خوب
34
00:00:58,079 –> 00:00:59,520
شروع کنیم، بنابراین اولین
35
00:00:59,520 –> 00:01:01,039
کاری که باید انجام دهیم این است که باید
36
00:01:01,039 –> 00:01:02,800
مجموعه دادههای خود را دانلود کنیم و این
37
00:01:02,800 –> 00:01:04,640
مستقیماً از Kaggle میآید، همانطور که میتوانید
38
00:01:04,640 –> 00:01:05,600
در اینجا ببینید،
39
00:01:05,600 –> 00:01:08,400
این مجموعه دادههای صنعت فیلم است،
40
00:01:08,400 –> 00:01:09,439
بیایید به
41
00:01:09,439 –> 00:01:11,760
اینجا برویم و فقط سریع نگاهی اجمالی
42
00:01:11,760 –> 00:01:12,560
43
00:01:12,560 –> 00:01:14,240
بیندازیم، 10 ستون از 15 ستون را به ما نشان میدهد، بنابراین
44
00:01:14,240 –> 00:01:16,080
ما واقعاً قادر به دیدن همه آنها نیستیم.
45
00:01:16,080 –> 00:01:17,200
در حال حاضر میتوانیم،
46
00:01:17,200 –> 00:01:18,320
اما نمیخواهم برای این کار وقت بگذارم،
47
00:01:18,320 –> 00:01:20,240
بنابراین
48
00:01:20,240 –> 00:01:22,720
ما بودجه داریم، شرکتی
49
00:01:22,720 –> 00:01:24,000
داریم که قرار است به
50
00:01:24,000 –> 00:01:26,799
مواردی مانند ژانر درآمد
51
00:01:26,799 –> 00:01:28,960
ناخالص کل فیلم، نام فیلم نگاه کنیم.
52
00:01:28,960 –> 00:01:31,840
در تاریخ انتشار، و
53
00:01:31,840 –> 00:01:33,040
سپس چند مورد دیگر وجود دارد و
54
00:01:33,040 –> 00:01:34,159
من در حال حاضر همه آنها را بررسی نمی کنم،
55
00:01:34,159 –> 00:01:36,079
زیرا ما زمان زیادی
56
00:01:36,079 –> 00:01:38,159
برای بررسی آن
57
00:01:38,159 –> 00:01:40,079
خواهیم داشت و همین الان روی دانلود کلیک می
58
00:01:40,079 –> 00:01:43,439
کنیم.
59
00:01:43,439 –> 00:01:45,600
کاری که اکنون باید انجام دهیم این است که به پوشه دانلودها برویم ایده
60
00:01:45,600 –> 00:01:47,040
پایتون خود را دانلود کنید،
61
00:01:47,040 –> 00:01:48,720
بنابراین کاری که ما میخواهیم انجام دهیم این است که
62
00:01:48,720 –> 00:01:49,920
از چیزی به نام
63
00:01:49,920 –> 00:01:51,840
نوتبوکهای jupyter استفاده
64
00:01:51,840 –> 00:01:54,240
میکنیم و میتوانیم آن را از طریق چیزی
65
00:01:54,240 –> 00:01:55,680
به نام آناکوندا دریافت کنیم، بنابراین ما اکنون آناکوندا را دانلود میکنیم تنها
66
00:01:55,680 –> 00:01:58,320
67
00:01:58,320 –> 00:02:00,799
کاری که باید انجام دهید این است که به درستی بروید. اینجا را
68
00:02:00,799 –> 00:02:02,000
کلیک کنید و دوباره روی دانلود کلیک
69
00:02:02,000 –> 00:02:03,280
کنید، همه این لینک ها را در
70
00:02:03,280 –> 00:02:05,520
توضیحات قرار می دهم، بنابراین
71
00:02:05,520 –> 00:02:08,239
اگر از مک استفاده می کنید یا
72
00:02:08,239 –> 00:02:09,280
اگر از لینوکس استفاده می کنید،
73
00:02:09,280 –> 00:02:10,639
فقط باید روی دانلود کلیک کنید، فقط روی یکی از آن ها کلیک کنید و می
74
00:02:10,639 –> 00:02:12,480
توانید آن نسخه را دریافت کنید. باید
75
00:02:12,480 –> 00:02:14,800
روی دانلود کلیک کنیم، من قصد ندارم
76
00:02:14,800 –> 00:02:17,680
77
00:02:17,680 –> 00:02:19,680
نصب واقعی آن را انجام دهم، زیرا بسیار
78
00:02:19,680 –> 00:02:20,800
آسان است،
79
00:02:20,800 –> 00:02:22,800
من پیش بینی نمی کنم کسی
80
00:02:22,800 –> 00:02:23,920
مشکلی داشته باشد، امیدوارم
81
00:02:23,920 –> 00:02:25,599
مگر اینکه مشکل ذخیره سازی داشته
82
00:02:25,599 –> 00:02:27,760
باشید، مثلاً جایی برای آن ندارید،
83
00:02:27,760 –> 00:02:30,560
اما فقط نصب کنید آن و
84
00:02:30,560 –> 00:02:31,040
همینجا
85
00:02:31,040 –> 00:02:34,239
این قرار است ظاهر شود و کاری که ما
86
00:02:34,239 –> 00:02:35,040
87
00:02:35,040 –> 00:02:36,480
میخواهیم انجام دهیم این است که روی این
88
00:02:36,480 –> 00:02:37,680
نوتبوک jupyter کلیک میکنیم، بنابراین ما آن را
89
00:02:37,680 –> 00:02:38,560
راهاندازی
90
00:02:38,560 –> 00:02:40,560
میکنیم البته من قبلاً این را
91
00:02:40,560 –> 00:02:42,239
در اینجا آوردهام اما من می خواهم آن را بالا
92
00:02:42,239 –> 00:02:43,599
بکشم در اینجا نیز
93
00:02:43,599 –> 00:02:45,120
اینجا جایی است که ما به نوعی پروژه های خود را ذخیره می کنیم
94
00:02:45,120 –> 00:02:47,200
این پروژه برای
95
00:02:47,200 –> 00:02:49,920
مدتی بعد است و اینها پروژه هایی هستند که من
96
00:02:49,920 –> 00:02:51,040
97
00:02:51,040 –> 00:02:52,239
قبلاً تکمیل کرده ام، بنابراین من قبلاً کل
98
00:02:52,239 –> 00:02:54,400
پروژه را تکمیل کرده ام، آن را در صفحه دیگری
99
00:02:54,400 –> 00:02:57,440
دقیقاً در اینجا دارم.
100
00:02:57,440 –> 00:03:01,360
من خیلی چیزها را دریافت خواهم کرد، اوه من فقط مقدار زیادی از آن را خواهم خواند،
101
00:03:01,360 –> 00:03:02,080
102
00:03:02,080 –> 00:03:05,120
زیرا زمان زیادی طول کشید تا ایجاد
103
00:03:05,120 –> 00:03:06,959
کنم، بنابراین نمی خواهم تا زمانی که ایجاد کردم طول بکشد،
104
00:03:06,959 –> 00:03:08,319
می خواهم این کار را سریع انجام دهم
105
00:03:08,319 –> 00:03:08,959
106
00:03:08,959 –> 00:03:11,040
بنابراین کاری که میخواهیم انجام دهیم این است که من
107
00:03:11,040 –> 00:03:13,040
هیچکدام از این موارد را بالا
108
00:03:13,040 –> 00:03:17,120
نمیآورم، میخواهم روی پایتون 3 کلیک جدید کنم.
109
00:03:17,120 –> 00:03:18,560
بنابراین به نظر میرسد این همان
110
00:03:18,560 –> 00:03:20,480
جایی است که ما شروع میکنیم،
111
00:03:20,480 –> 00:03:24,080
ببخشید دوم،
112
00:03:25,200 –> 00:03:27,920
پس کاری که باید انجام دهیم ابتدا باید
113
00:03:27,920 –> 00:03:29,280
کتابخانههایمان
114
00:03:29,280 –> 00:03:32,560
را وارد کنیم یا بستهها را وارد
115
00:03:32,560 –> 00:03:34,560
کنیم و سپس دادهها را درست بخوانیم،
116
00:03:34,560 –> 00:03:36,239
بنابراین اولین
117
00:03:36,239 –> 00:03:40,080
کار واردات
118
00:03:40,080 –> 00:03:43,760
کتابخانهها است و از
119
00:03:43,760 –> 00:03:46,480
بسیاری از کلاسیکها استفاده میکنیم. آنهایی که من نمیخواهم
120
00:03:46,480 –> 00:03:47,920
زمان زیادی را روی این بخش تلف
121
00:03:47,920 –> 00:03:49,440
کنم، بنابراین من فقط میخواهم
122
00:03:49,440 –> 00:03:51,760
این را اینجا بچسبانم، اما شما بچهها میتوانید
123
00:03:51,760 –> 00:03:53,120
انجام دهید همان چیزی که
124
00:03:53,120 –> 00:03:55,040
من این را در github خواهم داشت
125
00:03:55,040 –> 00:03:56,720
به پیوند نگاه کنید همه چیزهایی که می
126
00:03:56,720 –> 00:03:58,159
خواهید ببینید در آنجا وجود دارد،
127
00:03:58,159 –> 00:03:59,840
بنابراین شما مجبور نیستید این را نیز بنویسید،
128
00:03:59,840 –> 00:04:01,599
اما زمانی که من در ابتدا این کار را انجام دادم
129
00:04:01,599 –> 00:04:03,519
فقط کمی طول کشید. نمیخواستم
130
00:04:03,519 –> 00:04:05,280
آن زمان را تلف کنم،
131
00:04:05,280 –> 00:04:06,560
اما چیزی که قرار است از آن استفاده کنیم،
132
00:04:06,560 –> 00:04:08,319
از پانداها به عنوان
133
00:04:08,319 –> 00:04:12,239
pd استفاده
134
00:04:12,239 –> 00:04:14,879
135
00:04:14,879 –> 00:04:16,720
136
00:04:16,720 –> 00:04:19,600
میکنیم. به شما توصیه می کنم که این کار را نیز انجام دهید،
137
00:04:19,600 –> 00:04:20,798
138
00:04:20,798 –> 00:04:24,479
ببخشید ما از پانداهای دریایی
139
00:04:24,479 –> 00:04:27,040
140
00:04:27,040 –> 00:04:28,240
141
00:04:28,240 –> 00:04:29,759
142
00:04:29,759 –> 00:04:31,759
143
00:04:31,759 –> 00:04:33,840
استفاده می کنیم. در حال انجام است،
144
00:04:33,840 –> 00:04:34,800
اما اکنون میتوانیم
145
00:04:34,800 –> 00:04:37,280
دادهها را بخوانیم، بنابراین بیایید
146
00:04:37,280 –> 00:04:38,400
همینجا برویم،
147
00:04:38,400 –> 00:04:42,000
من میخواهم بگویم دادهها را بخوانید،
148
00:04:42,000 –> 00:04:43,520
تنها کاری که باید انجام دهیم این است که
149
00:04:43,520 –> 00:04:45,840
از پانداها برای این کار استفاده کنیم.
150
00:04:45,840 –> 00:04:46,400
برای ایجاد
151
00:04:46,400 –> 00:04:49,919
یک قاب داده با استفاده از ام،
152
00:04:49,919 –> 00:04:52,240
فقط فکر میکنم csv خوانده میشود، بنابراین بسیار
153
00:04:52,240 –> 00:04:55,440
آسان است، بنابراین ما میخواهیم df.read
154
00:04:55,440 –> 00:04:59,280
underscore csv op انجام دهیم. در پرانتز و سپس
155
00:04:59,280 –> 00:05:02,639
اوم، این آپستروف ها چیستند،
156
00:05:02,639 –> 00:05:04,800
بله فقط آپستروف ها، من فکر می کنم کاری که
157
00:05:04,800 –> 00:05:06,639
اکنون باید انجام دهیم این است که باید مکان
158
00:05:06,639 –> 00:05:08,720
آن را در پوشه خود پیدا کنیم، بنابراین اگر
159
00:05:08,720 –> 00:05:10,560
دقیقاً به اینجا
160
00:05:10,560 –> 00:05:14,000
برویم، این فیلم ها را دقیقاً در اینجا داریم، می توانیم
161
00:05:14,000 –> 00:05:15,840
روی آن کلیک راست کنیم. و اگر میخواهید
162
00:05:15,840 –> 00:05:17,759
این کاری است که من معمولا انجام میدهم این است که
163
00:05:17,759 –> 00:05:20,080
دقیقاً به اینجا میروم، مکان میگوید
164
00:05:20,080 –> 00:05:21,360
کاربران را مشاهده کنید alex f
165
00:05:21,360 –> 00:05:23,520
downloads که همان جایی است که در
166
00:05:23,520 –> 00:05:24,720
آن قرار دارد،
167
00:05:24,720 –> 00:05:26,720
بنابراین ما میخواهیم دقیقاً به اینجا
168
00:05:26,720 –> 00:05:28,400
برویم. این
169
00:05:28,400 –> 00:05:30,320
و ما فقط نام را تایپ می کنیم
170
00:05:30,320 –> 00:05:33,360
و آن را movies.csv
171
00:05:33,360 –> 00:05:37,120
می کنیم تا به همان راحتی که قرار است دریافت
172
00:05:37,120 –> 00:05:40,400
شود، احتمالاً چند چیز بعدی
173
00:05:40,400 –> 00:05:40,800
احتمالاً
174
00:05:40,800 –> 00:05:43,360
به همین راحتی است که به دست می آید، بنابراین بیایید
175
00:05:43,360 –> 00:05:44,479
این کار را خیلی سریع اجرا کنیم و ما باید
176
00:05:44,479 –> 00:05:46,160
یک خطایی دریافت
177
00:05:46,160 –> 00:05:50,320
کنیم که میخواهد بگوید یونیکد از شما فرار میکند
178
00:05:50,320 –> 00:05:52,080
تمام کاری که باید انجام دهید تا این مشکل را حل کنید
179
00:05:52,080 –> 00:05:53,360
و این اتفاق میافتد اگر این کار را انجام ندهید همیشه این
180
00:05:53,360 –> 00:05:54,639
اتفاق میافتد
181
00:05:54,639 –> 00:05:57,840
فقط باید یک r را وارد کنید خوب است، بنابراین اکنون
182
00:05:57,840 –> 00:05:59,600
باید
183
00:05:59,600 –> 00:06:02,960
کار کند. من می گویم آه من گفتم df چرا
184
00:06:02,960 –> 00:06:03,919
گفتم که چرا
185
00:06:03,919 –> 00:06:05,280
کسی باید داشته باشد به من گفت که این کار را انجام میدهم.
186
00:06:05,280 –> 00:06:07,280
اوم ما قرار است این کار را انجام دهیم فریم داده
187
00:06:07,280 –> 00:06:10,080
برابر است با df فقط مخفف قاب داده است،
188
00:06:10,080 –> 00:06:11,600
بنابراین pd از پاندا استفاده میکنیم، نمیدانم
189
00:06:11,600 –> 00:06:12,960
چرا نوشتم که دارم از خودم جلوتر
190
00:06:12,960 –> 00:06:13,919
میروم.
191
00:06:13,919 –> 00:06:15,520
“قرار است اجرا شود که باید
192
00:06:15,520 –> 00:06:17,440
کار کند، بنابراین کار کرد
193
00:06:17,440 –> 00:06:20,720
و اجازه دهید به آن نگاه کنیم، بنابراین بیایید بگوییم
194
00:06:20,720 –> 00:06:23,680
بیایید به دادههایی نگاه کنیم که فقط
195
00:06:23,680 –> 00:06:24,479
میخواهیم
196
00:06:24,479 –> 00:06:27,759
سر نقطه df انجام دهیم و سپس
197
00:06:27,759 –> 00:06:29,759
پرانتزهایی را که میخواهیم این را
198
00:06:29,759 –> 00:06:31,520
نیز اجرا کنیم تا یک نگاه اجمالی واقعاً سریع داشته باشید،
199
00:06:31,520 –> 00:06:33,039
بنابراین این دقیقاً مانند پنج ردیف بالا است،
200
00:06:33,039 –> 00:06:34,800
201
00:06:34,800 –> 00:06:36,560
بنابراین ما بودجه شرکت خود را داریم، برخی
202
00:06:36,560 –> 00:06:37,600
از مواردی که قبلاً به آنها نگاه میکردیم
203
00:06:37,600 –> 00:06:40,000
204
00:06:40,560 –> 00:06:43,520
و مواردی که قبلاً ندیده بودیم، فکر میکنم
205
00:06:43,520 –> 00:06:44,639
206
00:06:44,639 –> 00:06:48,000
سال نویسنده امتیاز ستاره بود
207
00:06:48,000 –> 00:06:50,960
و ما پس از مدتی وارد همه
208
00:06:50,960 –> 00:06:51,759
209
00:06:51,759 –> 00:06:53,440
اینها خواهم شد، اولین کاری که میخواهیم
210
00:06:53,440 –> 00:06:56,160
انجام دهیم این است که دادهها
211
00:06:56,160 –> 00:06:59,120
را هر چند ثانیه یکبار پاک
212
00:06:59,120 –> 00:07:00,639
میکنم.
213
00:07:00,639 –> 00:07:02,319
حداقل
214
00:07:02,319 –> 00:07:03,599
کمی طولانی تر،
215
00:07:03,599 –> 00:07:06,000
اما ما قرار است داده ها را تمیز کنیم
216
00:07:06,000 –> 00:07:07,039
و فقط آنها را طوری
217
00:07:07,039 –> 00:07:08,800
قالب بندی کنیم که به آن نیاز داریم.
218
00:07:08,800 –> 00:07:10,240
چه کاری قرار است انجام
219
00:07:10,240 –> 00:07:12,479
دهیم یا برای چه
220
00:07:12,479 –> 00:07:14,720
کاری قرار است روی
221
00:07:14,720 –> 00:07:16,240
آن کار کنیم، قبلاً گفتم
222
00:07:16,240 –> 00:07:18,400
روی چیزی کار نمی کنیم که فکر می کنم اکثر مردم
223
00:07:18,400 –> 00:07:20,000
فکر می کردند ما روی آن کار نمی کنیم.
224
00:07:20,000 –> 00:07:21,599
از پانداها استفاده خواهیم کرد تا اساساً
225
00:07:21,599 –> 00:07:23,280
از آن مانند یک دنباله استفاده
226
00:07:23,280 –> 00:07:24,960
کنیم، جایی که ما میدانیم مانند خریدهای گروهی انجام
227
00:07:24,960 –> 00:07:26,319
میدهیم و
228
00:07:26,319 –> 00:07:28,160
همه این چیزها به
229
00:07:28,160 –> 00:07:29,440
نوعی در جهت متفاوتی پیش میرویم، ما
230
00:07:29,440 –> 00:07:31,199
روی همبستگیها
231
00:07:31,199 –> 00:07:32,639
کار خواهیم کرد، بنابراین اگر شما نمی دانید چه ارتباطی وجود
232
00:07:32,639 –> 00:07:34,560
دارد مثلاً
233
00:07:34,560 –> 00:07:36,720
می دانید فرض کنید با افزایش بودجه
234
00:07:36,720 –> 00:07:37,599
235
00:07:37,599 –> 00:07:40,080
شما همچنین انتظار دارید که
236
00:07:40,080 –> 00:07:40,960
اگر
237
00:07:40,960 –> 00:07:42,960
100 میلیون دلار برای فیلمی خرج کنند، شما انتظار دارید
238
00:07:42,960 –> 00:07:44,240
239
00:07:44,240 –> 00:07:46,720
500 میلیون دلار بسازند یا اگر آنها صفر دلار برای شما خرج کنند،
240
00:07:46,720 –> 00:07:47,520
درآمد نیز افزایش
241
00:07:47,520 –> 00:07:50,319
می یابد. از آنها انتظار داشته باشید که
242
00:07:50,319 –> 00:07:52,000
ده هزار دلار درآمد
243
00:07:52,000 –> 00:07:53,520
داشته باشند، این همبستگی بالایی دارد،
244
00:07:53,520 –> 00:07:55,280
زیرا اگر کم باشد، پایین ترین بالا،
245
00:07:55,280 –> 00:07:55,840
246
00:07:55,840 –> 00:07:57,360
زیاد است، بنابراین ما این کار را
247
00:07:57,360 –> 00:07:59,440
برای همه زمینه هایی که در اینجا می بینید انجام خواهیم داد
248
00:07:59,440 –> 00:08:00,240
و سعی می
249
00:08:00,240 –> 00:08:03,280
کنیم چه زمینه هایی را پیدا کنیم.
250
00:08:03,280 –> 00:08:05,120
آنچه را که مستقیماً همبسته یا شدیداً مرتبط هستند را هدایت کنید
251
00:08:05,120 –> 00:08:07,520
با این درآمد ناخالص مرتبط است،
252
00:08:07,520 –> 00:08:10,240
زیرا باز هم فکر میکنم
253
00:08:10,240 –> 00:08:12,240
جالب است بدانیم چه چیزهایی
254
00:08:12,240 –> 00:08:15,599
بر
255
00:08:15,599 –> 00:08:18,639
درآمد یک فیلم تأثیر میگذارند، بنابراین این چیزی است
256
00:08:18,639 –> 00:08:20,080
که به نظرم جالب بود، به همین دلیل است که ما
257
00:08:20,080 –> 00:08:21,599
آن را انجام میدهیم زیرا میدانید که من دوباره
258
00:08:21,599 –> 00:08:23,360
این را ایجاد کردم. من
259
00:08:23,360 –> 00:08:25,440
فقط کمی متفاوت با جریان
260
00:08:25,440 –> 00:08:27,199
261
00:08:27,199 –> 00:08:28,639
هستم، امیدوارم که هیجان انگیز باشد، ما
262
00:08:28,639 –> 00:08:31,039
از چیزهای واقعاً سرگرم کننده ای استفاده خواهیم کرد،
263
00:08:31,039 –> 00:08:33,120
اما با این گفته من
264
00:08:33,120 –> 00:08:34,479
خودم را از اینجا دور می کنم تا شما بچهها
265
00:08:34,479 –> 00:08:36,000
میتوانند تمام صفحه من را ببینند و ما فقط میخواهیم
266
00:08:36,000 –> 00:08:36,880
267
00:08:36,880 –> 00:08:40,640
خداحافظی کنیم، من دلم برایت تنگ خواهد شد،
268
00:08:40,640 –> 00:08:41,919
اما میدانی که دوباره همدیگر را میبینیم،
269
00:08:41,919 –> 00:08:44,080
قول میدهم در یک ویدیوی آینده خیلی خوب باشد،
270
00:08:44,080 –> 00:08:45,839
بنابراین کاری که میخواهیم انجام دهیم این است که
271
00:08:45,839 –> 00:08:47,600
درست بیایم در اینجا و
272
00:08:47,600 –> 00:08:49,040
ما میخواهیم ببینیم آیا
273
00:08:49,040 –> 00:08:51,040
دادهای از دست رفته است یا نه،
274
00:08:51,040 –> 00:08:54,160
بیایید ببینیم آیا دادهای از دست رفته است،
275
00:08:54,160 –> 00:08:56,800
من این را به عنوان توضیحاتم قرار نمیدهم
276
00:08:56,800 –> 00:08:57,519
277
00:08:57,519 –> 00:08:58,640
و آن را به چیزی
278
00:08:58,640 –> 00:09:00,240
که منطقی است تغییر نمیدهم، اما ما آن
279
00:09:00,240 –> 00:09:01,200
را حفظ میکنیم.
280
00:09:01,200 –> 00:09:04,320
راه های زیادی برای انجام این کار وجود دارد
281
00:09:04,320 –> 00:09:06,000
اما من چه هستم کاری که باید انجام دهم این است که من
282
00:09:06,000 –> 00:09:08,080
یک حلقه for ایجاد میکنم که فقط میخواهیم
283
00:09:08,080 –> 00:09:11,279
از میان این ستونها حلقه بزنیم و در
284
00:09:11,279 –> 00:09:12,240
هر کدام
285
00:09:12,240 –> 00:09:14,800
ببینیم که آیا
286
00:09:14,800 –> 00:09:15,920
میدانی دادهای در آن وجود ندارد،
287
00:09:15,920 –> 00:09:19,920
بنابراین میگوییم 4 ستون
288
00:09:19,920 –> 00:09:23,200
و نقطه فریم ستونها
289
00:09:23,200 –> 00:09:27,440
و ما میخواهیم بگوییم بیایید
290
00:09:27,440 –> 00:09:31,040
np dot mean را
291
00:09:31,040 –> 00:09:33,440
انجام دهیم و یک
292
00:09:33,440 –> 00:09:35,760
پرانتز باز میکنیم یا با عرض پوزش، یک پرانتز باز میکنیم، میخواهیم
293
00:09:35,760 –> 00:09:38,160
قاب داده را انجام دهیم و میخواهیم در
294
00:09:38,160 –> 00:09:39,680
آن ستون مانند همین بالا اینجا قرار دهیم
295
00:09:39,680 –> 00:09:41,760
تا زمانی که آن ستون در
296
00:09:41,760 –> 00:09:43,279
اینجا درج میشود، میگوید ستون مشخصشده قاب دادهای را انجام
297
00:09:43,279 –> 00:09:46,640
میدهیم و سپس میخواهیم این
298
00:09:46,640 –> 00:09:47,120
کار را انجام دهیم
299
00:09:47,120 –> 00:09:50,480
وای نقطه تهی است و
300
00:09:50,480 –> 00:09:54,000
پرانتز را باز کنید،
301
00:09:54,720 –> 00:09:57,279
خیلی ساده است، حدس میزنم
302
00:09:57,279 –> 00:09:58,480
ما میخواهیم بگوییم که این را صدا میزنیم
303
00:09:58,480 –> 00:10:00,320
درصد
304
00:10:00,320 –> 00:10:04,240
از دست رفته است، بنابراین ما این کار را انجام می دهیم،
305
00:10:04,240 –> 00:10:06,720
سپس کاری که می خواهیم انجام دهیم این است که می
306
00:10:06,720 –> 00:10:07,279
307
00:10:07,279 –> 00:10:09,760
خواهیم خروجی خود را ایجاد کنیم، بنابراین می خواهیم این را چاپ
308
00:10:09,760 –> 00:10:10,320
309
00:10:10,320 –> 00:10:11,839
کنیم، بنابراین می خواهیم um را چاپ کنیم و
310
00:10:11,839 –> 00:10:13,920
بیایید کمی قالب بندی um را انجام دهیم
311
00:10:13,920 –> 00:10:15,680
و این صرفاً برای
312
00:10:15,680 –> 00:10:18,079
اهداف بصری برای شما،
313
00:10:18,079 –> 00:10:19,279
اما
314
00:10:19,279 –> 00:10:21,839
اگر نمی خواهید مجبور نیستید این کار را انجام دهید،
315
00:10:21,839 –> 00:10:24,399
اما من می خواهم o این را می پسندیم و سپس
316
00:10:24,399 –> 00:10:25,920
ما
317
00:10:25,920 –> 00:10:28,399
می خواهیم قالب خود را برای این درج کنیم،
318
00:10:28,399 –> 00:10:32,160
بنابراین می خواهیم
319
00:10:32,160 –> 00:10:34,800
یک لحظه به من برگردیم بیایید به اینجا برگردیم
320
00:10:34,800 –> 00:10:36,480
این علامت درصد را اضافه
321
00:10:36,480 –> 00:10:39,519
کنیم تا فرمت نقطه ای را انجام دهیم
322
00:10:39,519 –> 00:10:41,920
و سپس آن را انجام دهیم نام ستونی است
323
00:10:41,920 –> 00:10:42,800
که درست خواهد بود
324
00:10:42,800 –> 00:10:45,040
که دقیقاً در اینجا درج می شود و
325
00:10:45,040 –> 00:10:46,480
سپس
326
00:10:46,480 –> 00:10:50,000
درصد زیر خط خود را حذف
327
00:10:50,000 –> 00:10:52,399
می کنیم، بنابراین بیایید این را خیلی سریع اجرا کنیم تا ببینیم آیا
328
00:10:52,399 –> 00:10:53,120
کار می کند
329
00:10:53,120 –> 00:10:55,600
یا خیر، np تعریف نشده است، احتمالاً
330
00:10:55,600 –> 00:10:58,839
به این دلیل است که من آن را وارد نکرده ام
331
00:10:58,839 –> 00:11:01,279
واردات uh numpy
332
00:11:01,279 –> 00:11:05,200
به عنوان np چرا من چرا من این کار را انجام ندادم
333
00:11:05,200 –> 00:11:07,839
حالا بیایید ببینیم آیا کار می کند یا خیر، ما
334
00:11:07,839 –> 00:11:09,200
برای بهترین های ما اتفاق می افتد.
335
00:11:09,200 –> 00:11:12,079
336
00:11:12,079 –> 00:11:13,920
337
00:11:13,920 –> 00:11:16,880
338
00:11:16,880 –> 00:11:18,399
ما اساساً
339
00:11:18,399 –> 00:11:20,079
همه چیزهایی را که نگاه میکردیم حلقه زدیم تا
340
00:11:20,079 –> 00:11:22,800
ببینیم آیا ستونهایی وجود دارد که دارای null باشد
341
00:11:22,800 –> 00:11:26,399
و به نظر میرسد
342
00:11:26,399 –> 00:11:29,519
هر سطر تک تک مقادیر پر شده است،
343
00:11:29,519 –> 00:11:31,279
بنابراین لازم نیست در حال حاضر
344
00:11:31,279 –> 00:11:33,760
حداقل در مورد آن
345
00:11:33,760 –> 00:11:37,440
um نگران باشیم. ادامه دهید تا قسمت بعدی
346
00:11:37,440 –> 00:11:38,399
347
00:11:38,399 –> 00:11:40,079
را انجام دهیم
348
00:11:40,079 –> 00:11:41,920
پاکسازی اولیه دادهها فکر میکنم قبلاً اشاره کردم،
349
00:11:41,920 –> 00:11:43,600
350
00:11:43,600 –> 00:11:45,040
بنابراین اولین چیزی که میخواهم به آن
351
00:11:45,040 –> 00:11:47,760
نگاه کنم انواع دادههای
352
00:11:47,760 –> 00:11:51,120
ستونهای ما هستند که انجام آن بسیار آسان است،
353
00:11:51,120 –> 00:11:55,040
ما فقط میخواهیم انواع df dot
354
00:11:55,040 –> 00:11:58,480
d را انجام دهیم و این را اجرا
355
00:11:58,480 –> 00:12:03,040
کنیم تا شناورها داشته باشیم. اشیاء
356
00:12:03,040 –> 00:12:06,639
اعداد صحیح و این در مورد
357
00:12:06,639 –> 00:12:09,680
آن چیزی است که من فوراً متوجه شدم
358
00:12:09,680 –> 00:12:12,720
این بود که حداقل در داده ها این بود که
359
00:12:12,720 –> 00:12:13,920
360
00:12:13,920 –> 00:12:15,920
این 80 میلیون است. فکر می کنم این
361
00:12:15,920 –> 00:12:17,360
چقدر است.
362
00:12:17,360 –> 00:12:19,519
بگذارید ببینم آیا این همان چیزی است که یک دو
363
00:12:19,519 –> 00:12:21,519
سه یک دو سه است فقط هشت میلیون
364
00:12:21,519 –> 00:12:22,800
خوب است، پس هشت میلیون وجود دارد، اما
365
00:12:22,800 –> 00:12:24,320
در پایان این نقطه صفر است،
366
00:12:24,320 –> 00:12:27,760
ما به آن امم نیاز نداریم و همان چیزی
367
00:12:27,760 –> 00:12:28,800
برای درآمد ناخالص
368
00:12:28,800 –> 00:12:30,160
، فکر می کنم این تنها چیزی است که
369
00:12:30,160 –> 00:12:32,240
این کار را انجام می دهد، فقط می خواهم از شر آن خلاص شوم
370
00:12:32,240 –> 00:12:33,200
371
00:12:33,200 –> 00:12:35,040
فقط به این دلیل که فکر میکنم
372
00:12:35,040 –> 00:12:36,399
عالی به نظر نمیرسد،
373
00:12:36,399 –> 00:12:39,120
ما به آن نیاز نداریم، بنابراین کاری که میخواهیم
374
00:12:39,120 –> 00:12:39,600
انجام دهیم این
375
00:12:39,600 –> 00:12:42,720
است که ابتدا مشخص کنیم به
376
00:12:42,720 –> 00:12:44,399
کدام ستون نگاه میکنیم، بنابراین
377
00:12:44,399 –> 00:12:46,000
کدام ستون هستیم
378
00:12:46,000 –> 00:12:48,720
ابتدا این بودجه انجام می شود، بنابراین
379
00:12:48,720 –> 00:12:49,440
ما می گوییم
380
00:12:49,440 –> 00:12:52,959
چارچوب داده و سپس دوباره به t نیاز داریم o می گوییم
381
00:12:52,959 –> 00:12:56,240
بودجه به طوری که ستونی را مشخص
382
00:12:56,240 –> 00:12:57,760
می کنیم که قرار است روی آن کار
383
00:12:57,760 –> 00:13:00,240
کنیم و ما به عنوان نوع انجام می دهیم، بنابراین این
384
00:13:00,240 –> 00:13:02,240
فقط نوع داده را تغییر می دهد
385
00:13:02,240 –> 00:13:06,240
و ما پرانتز را باز می کنیم
386
00:13:06,240 –> 00:13:08,880
um apostrophe امیدوارم
387
00:13:08,880 –> 00:13:09,920
388
00:13:09,920 –> 00:13:11,440
اگر من آن را آپستروف و
389
00:13:11,440 –> 00:13:12,720
چیز دیگری
390
00:13:12,720 –> 00:13:14,079
391
00:13:14,079 –> 00:13:17,200
مینامم به این میگویند که یک احمق مطلق هستم، بنابراین آن را به یک
392
00:13:17,200 –> 00:13:18,399
عدد صحیح تغییر
393
00:13:18,399 –> 00:13:21,519
میدهیم، اما باید آن را درست اعمال کنیم، بنابراین
394
00:13:21,519 –> 00:13:24,720
این
395
00:13:24,800 –> 00:13:27,120
را میگیریم در غیر این صورت آن را اعمال نمیکند، بنابراین ما
396
00:13:27,120 –> 00:13:30,000
دقیقاً همین کار را انجام میدهیم
397
00:13:30,000 –> 00:13:32,240
و من فقط میخواهم تغییر یادداشت را انجام
398
00:13:32,240 –> 00:13:33,600
دهم که
399
00:13:33,600 –> 00:13:36,560
نوع ستونها ممکن است چیزی
400
00:13:36,560 –> 00:13:37,519
بهتر از این باشد،
401
00:13:37,519 –> 00:13:40,800
لطفاً من فقط این کار را انجام میدهم به سرعت برای
402
00:13:40,800 –> 00:13:42,079
اهدافمان، بنابراین ما فقط میخواهیم آن را کپی
403
00:13:42,079 –> 00:13:43,360
کنیم که دقیقاً همان کار را انجام میدهیم
404
00:13:43,360 –> 00:13:45,920
405
00:13:45,920 –> 00:13:49,519
و بیایید این را اجرا کنیم و نگاهی بیندازیم
406
00:13:49,519 –> 00:13:51,519
و ببینیم آیا واقعاً کار میکند یا
407
00:13:51,519 –> 00:13:53,680
نه، بنابراین ما فقط چارچوب دادههای خود را اجرا میکنیم
408
00:13:53,680 –> 00:13:55,120
و اکنون کمی بهتر به نظر می رسد
409
00:13:55,120 –> 00:13:57,440
درست است، چیز بزرگی نیست، یک تغییر فوق العاده
410
00:13:57,440 –> 00:13:59,040
کوچک است،
411
00:13:59,040 –> 00:14:02,560
اما اینطور است
412
00:14:02,560 –> 00:14:04,480
مورد بعدی که میخواهم به آن نگاه کنم کار میکند
413
00:14:04,480 –> 00:14:06,320
و
414
00:14:06,320 –> 00:14:08,399
این چیزی است که شما ممکن است متوجه آن نشوید، مگر اینکه به
415
00:14:08,399 –> 00:14:09,920
نوعی به دادهها نگاه کنید،
416
00:14:09,920 –> 00:14:11,360
اما
417
00:14:11,360 –> 00:14:14,399
اگر به اینجا برگردیم
418
00:14:14,399 –> 00:14:17,279
و من در واقع الان هستم، امسال اینجا کار میکند.
419
00:14:17,279 –> 00:14:19,279
420
00:14:19,279 –> 00:14:21,279
اگر به اینجا نگاه کنید همه اینها را وارد می کنیم، می گوید که
421
00:14:21,279 –> 00:14:23,360
422
00:14:23,360 –> 00:14:25,199
سال سال انتشار است و
423
00:14:25,199 –> 00:14:27,440
سپس این ستون را به نام تاریخ انتشار داریم،
424
00:14:27,440 –> 00:14:30,079
بنابراین سال در انتشار و سال
425
00:14:30,079 –> 00:14:31,040
و
426
00:14:31,040 –> 00:14:33,519
سال باید از نظر فرضی مطابقت داشته باشند.
427
00:14:33,519 –> 00:14:34,560
آنها همیشه اوم نمی کنند،
428
00:14:34,560 –> 00:14:38,240
بنابراین اینجا 2016 است. اینجا 2017 است.
429
00:14:38,240 –> 00:14:39,760
بیایید ببینیم آیا این بالا وجود دارد
430
00:14:39,760 –> 00:14:41,680
که نشان دهد
431
00:14:41,680 –> 00:14:44,399
تعداد زیادی از آنها وجود دارد، اگرچه من تعداد زیادی از آنها وجود
432
00:14:44,399 –> 00:14:46,480
دارد یا مانند سال 1987
433
00:14:46,480 –> 00:14:48,639
که می گوید 1986، بنابراین می توانید مرور کنید و
434
00:14:48,639 –> 00:14:50,399
ببینید
435
00:14:50,399 –> 00:14:53,120
من نمی خواهم انجام دهم
436
00:14:53,120 –> 00:14:53,600
که
437
00:14:53,600 –> 00:14:56,880
اگر بخواهید می توانید انجام دهید،
438
00:14:56,880 –> 00:14:59,920
اما باز هم این کار زمان بیشتری
439
00:14:59,920 –> 00:15:01,519
می برد تا به نوعی
440
00:15:01,519 –> 00:15:02,720
در داده ها کاوش کنید، اما این چیزی است که شما باید انجام دهید
441
00:15:02,720 –> 00:15:04,480
برای اینکه بفهمیم چگونه داده ها را پاک کنیم،
442
00:15:04,480 –> 00:15:07,360
بنابراین بیایید کاری را که قرار است انجام دهیم، انجام دهیم
443
00:15:07,360 –> 00:15:08,320
آیا میخواهیم آن را درست کنیم
444
00:15:08,320 –> 00:15:09,600
و با
445
00:15:09,600 –> 00:15:11,519
تغییر این یکی نمیتوانیم آن را برطرف کنیم، اما کاری که
446
00:15:11,519 –> 00:15:12,720
میخواهیم انجام دهیم این است
447
00:15:12,720 –> 00:15:14,639
که یک ستون جدید ایجاد
448
00:15:14,639 –> 00:15:18,160
میکنیم، بنابراین این را میگیریم
449
00:15:18,160 –> 00:15:21,120
ستون سال منتشر شد و
450
00:15:21,120 –> 00:15:23,839
ما فقط این چهار مقدار اول را می گیریم
451
00:15:23,839 –> 00:15:26,800
و این به ستون سال جدید ما تبدیل می
452
00:15:26,800 –> 00:15:27,519
شود
453
00:15:27,519 –> 00:15:29,519
بسیار خوب است، بنابراین من سالی را
454
00:15:29,519 –> 00:15:31,680
که ممکن است بعدا ممکن است آن را حذف کنیم حذف نمی کنم،
455
00:15:31,680 –> 00:15:32,880
اما در حال حاضر می رویم برای
456
00:15:32,880 –> 00:15:34,079
ایجاد این ستون جدید، بنابراین ما میخواهیم
457
00:15:34,079 –> 00:15:35,839
بگوییم df
458
00:15:35,839 –> 00:15:38,160
و سپس آپاستروف براکت را انجام میدهیم،
459
00:15:38,160 –> 00:15:40,880
واقعاً به شما
460
00:15:40,880 –> 00:15:42,160
میگویم اگر این را اشتباه میگویم، کل این ویدیو
461
00:15:42,160 –> 00:15:43,759
من میروم من نمیروم برای
462
00:15:43,759 –> 00:15:45,040
خوشحال بودن در مورد آن
463
00:15:45,040 –> 00:15:47,199
ام و ما آن را از نسخه
464
00:15:47,199 –> 00:15:48,160
منتشر شده می
465
00:15:48,160 –> 00:15:50,240
گیریم، بنابراین دوباره از این
466
00:15:50,240 –> 00:15:51,600
ستون منتشر شده استفاده می کنیم
467
00:15:51,600 –> 00:15:53,519
و کاری که می خواهیم انجام دهیم این است که ما به
468
00:15:53,519 –> 00:15:55,360
سمت آن می رویم که باید
469
00:15:55,360 –> 00:15:59,519
همین الان اینکه چه نوع داده ای
470
00:15:59,519 –> 00:16:01,199
منتشر شده است، این یک شی است که من می خواهم
471
00:16:01,199 –> 00:16:03,199
آن را به یک رشته تبدیل کنم
472
00:16:03,199 –> 00:16:06,560
تا بتوانم از آن بیرون بکشم یا رشته را از شما بگیرم
473
00:16:06,560 –> 00:16:07,600
474
00:16:07,600 –> 00:16:09,360
تا به عنوان تایپ کنید و ما این را ایجاد
475
00:16:09,360 –> 00:16:11,199
می کنیم زیرا می خواهیم این را به یک
476
00:16:11,199 –> 00:16:12,160
رشته تبدیل کنیم و سپس
477
00:16:12,160 –> 00:16:14,079
کاری که می خواهیم انجام دهیم این است که چهار رشته اول را بگیریم
478
00:16:14,079 –> 00:16:15,680
479
00:16:15,680 –> 00:16:17,279
و سپس براکت باز و سپس
480
00:16:17,279 –> 00:16:20,320
481
00:16:20,320 –> 00:16:23,600
کولون 4 را انجام دهیم. شما همچنین می توانید صفر را انجام دهید اما
482
00:16:23,600 –> 00:16:24,880
قابل درک است که فقط
483
00:16:24,880 –> 00:16:26,399
اگر آن را خالی بگذارید،
484
00:16:26,399 –> 00:16:28,399
از همان ابتدا شروع می شود و بیایید
485
00:16:28,399 –> 00:16:29,600
این جدید
486
00:16:29,600 –> 00:16:31,440
را ایجاد کنیم که اسمش را می گذاریم، بنابراین ما این
487
00:16:31,440 –> 00:16:33,040
کار را انجام می
488
00:16:33,040 –> 00:16:37,040
دهیم و می توانیم سال را با تاکید بر سال انجام دهیم،
489
00:16:37,040 –> 00:16:39,120
در واقع همه این موارد زیر سال هستند.
490
00:16:39,120 –> 00:16:40,480
درست است
491
00:16:40,480 –> 00:16:43,759
و ما این کار را دقیقاً به این صورت انجام
492
00:16:43,759 –> 00:16:47,519
می دهیم و می گوییم
493
00:16:47,519 –> 00:16:51,839
ستون سال درست را ایجاد کنید،
494
00:16:52,160 –> 00:16:55,920
بنابراین بیایید این را اینجا اضافه کنیم، اجازه دهید
495
00:16:55,920 –> 00:16:59,040
آن را اجرا کنیم و ببینیم چه چیزی به دست می آوریم
496
00:16:59,759 –> 00:17:02,079
و بنابراین این ستون سال اصلی
497
00:17:02,079 –> 00:17:03,199
است که 2016 داشت
498
00:17:03,199 –> 00:17:06,319
و این آیا ستون سال ما دارای 2017 است،
499
00:17:06,319 –> 00:17:07,520
درست به نظر می رسد،
500
00:17:07,520 –> 00:17:10,160
من معتقدم که وجود دارد، نمی دانم
501
00:17:10,160 –> 00:17:10,880
502
00:17:10,880 –> 00:17:12,880
چرا یکی در اینجا اشتباه کرده است، اوه
503
00:17:12,880 –> 00:17:14,079
آنها آن اشتباه را مرتکب شده اند، اما
504
00:17:14,079 –> 00:17:15,520
به نظر می رسد این همان چیزی است که هست و مال ما
505
00:17:15,520 –> 00:17:17,199
آن را برطرف می کند، بنابراین اگر ما اصلاً از
506
00:17:17,199 –> 00:17:18,240
آن سال استفاده
507
00:17:18,240 –> 00:17:20,319
خواهیم کرد، من فکر می کنم از سالی که شما درست می گویید،
508
00:17:20,319 –> 00:17:21,679
آن را حذف خواهیم کرد گفته شد که شما درست می گویید،
509
00:17:21,679 –> 00:17:22,240
این چیزی است که
510
00:17:22,240 –> 00:17:24,720
ما از آن خارج خواهیم شد، بنابراین ما فقط
511
00:17:24,720 –> 00:17:26,000
آن را اصلاح کردیم و
512
00:17:26,000 –> 00:17:28,400
باید خوب باشیم
513
00:17:28,400 –> 00:17:29,840
که آخرین کاری را که قرار است انجام دهم، انجام دهیم
514
00:17:29,840 –> 00:17:33,760
، حدس می زنم شما
515
00:17:33,760 –> 00:17:36,400
واقعاً هر کاری را که با آن انجام می دهیم، می دانید
516
00:17:36,400 –> 00:17:38,320
داده ها این است که من فقط آن را سفارش می دهم
517
00:17:38,320 –> 00:17:39,919
بسیار ساده است، من فقط می خواهم آن را
518
00:17:39,919 –> 00:17:41,520
بر اساس
519
00:17:41,520 –> 00:17:43,600
درآمد ناخالص سفارش دهم، بنابراین ما به
520
00:17:43,600 –> 00:17:46,080
اینجا می آییم، ما می خواهیم
521
00:17:46,080 –> 00:17:50,640
مقادیر مرتب سازی نقطه df را بگوییم
522
00:17:50,640 –> 00:17:53,679
و ما می خواهیم بگویید خرید کنید
523
00:17:53,679 –> 00:17:55,840
و سپس یک براکت باز باز یا جلوگیری از باز کردن برابر انجام دهید
524
00:17:55,840 –> 00:17:57,120
525
00:17:57,120 –> 00:17:58,400
و ما فقط آن ستون ناخالص را مشخص
526
00:17:58,400 –> 00:18:00,480
527
00:18:00,480 –> 00:18:04,400
می کنیم و m مکان را برابر با
528
00:18:04,400 –> 00:18:08,000
false oops false capital
529
00:18:08,000 –> 00:18:10,960
و سپس صعودی انجام می دهیم و این
530
00:18:10,960 –> 00:18:11,360
برابر
531
00:18:11,360 –> 00:18:13,360
با false خواهد بود زیرا من می خواهم آن را در حال
532
00:18:13,360 –> 00:18:14,720
نزول باشید
533
00:18:14,720 –> 00:18:16,960
پس بیایید به این نگاه کنیم تا بیشترین
534
00:18:16,960 –> 00:18:18,000
درآمد را داشته باشد و
535
00:18:18,000 –> 00:18:19,840
متوجه روندی خواهید شد که برخی از
536
00:18:19,840 –> 00:18:21,679
537
00:18:21,679 –> 00:18:25,600
پرفروشترین فیلمها واقعاً بزرگ هستند.
538
00:18:25,600 –> 00:18:26,160
539
00:18:26,160 –> 00:18:28,160
540
00:18:28,160 –> 00:18:30,080
541
00:18:30,080 –> 00:18:32,640
میدونم فکر نمیکنم تف
542
00:18:32,640 –> 00:18:33,360
روی قبرت
543
00:18:33,360 –> 00:18:36,799
دوتا پرطرفدارترین فیلم بود
544
00:18:36,799 –> 00:18:40,240
خارق العاده ام دو، می دانید که دیدم، این نبود
545
00:18:40,240 –> 00:18:40,880
546
00:18:40,880 –> 00:18:44,000
، آیا شما فنجان چای من را نمی دانستید
547
00:18:44,000 –> 00:18:46,080
، فکر می کنم تمام درآمد آنها بوده است.
548
00:18:46,080 –> 00:18:47,520
549
00:18:47,520 –> 00:18:51,440
550
00:18:51,440 –> 00:18:54,640
551
00:18:54,640 –> 00:18:56,640
شما میتوانید به جایی برسیم که
552
00:18:56,640 –> 00:18:58,080
اینها را ندارد،
553
00:18:58,080 –> 00:18:59,120
میدانید که ما فقط
554
00:18:59,120 –> 00:19:00,480
کمی از دادهها را بررسی میکنیم، فرض کنید
555
00:19:00,480 –> 00:19:02,160
میخواهیم همه دادهها را بررسی
556
00:19:02,160 –> 00:19:04,400
کنیم، بیایید به سرعت این کار را انجام دهیم، زیرا
557
00:19:04,400 –> 00:19:05,919
مطمئن هستم که برخی از شما بچه ها تعجب می کنید که چگونه
558
00:19:05,919 –> 00:19:06,559
این کار را انجام دهید،
559
00:19:06,559 –> 00:19:07,840
شاید شما این کار را نکنید، اما من به
560
00:19:07,840 –> 00:19:09,360
شما نشان می دهم که چگونه این کار را انجام دهید، بنابراین ما
561
00:19:09,360 –> 00:19:09,679
562
00:19:09,679 –> 00:19:13,760
گزینه های زیرخط مجموعه نقطه PD را انجام می دهیم
563
00:19:13,760 –> 00:19:17,520
و می خواهیم بگوییم آه، پرانتز را باز کنید
564
00:19:17,520 –> 00:19:18,720
565
00:19:18,720 –> 00:19:22,320
نمایش آپستروف اوه
566
00:19:22,320 –> 00:19:26,000
سطرهای زیر خط حداکثر نقطه را نمایش می دهد و این به صورت لایک تنظیم شده است،
567
00:19:26,000 –> 00:19:26,720
568
00:19:26,720 –> 00:19:29,440
من فکر می کنم به طور پیش فرض مانند 20 یا چیزی شبیه به اوم است
569
00:19:29,440 –> 00:19:31,520
و ما فقط می گوییم هیچکدام،
570
00:19:31,520 –> 00:19:33,840
بنابراین این کار را همین جا انجام
571
00:19:33,840 –> 00:19:34,799
می دهیم و این را اجرا می کنیم
572
00:19:34,799 –> 00:19:38,000
oops what من اشتباه می کنم چیزی
573
00:19:38,000 –> 00:19:41,039
به نام مجموعه گزینه های زیرخط ندارد
574
00:19:41,039 –> 00:19:42,240
، به این دلیل است که قرار است
575
00:19:42,240 –> 00:19:44,400
گزینه زیرخط تنظیم
576
00:19:44,400 –> 00:19:45,919
شده باشد، بنابراین باید خوب، بیایید
577
00:19:45,919 –> 00:19:48,000
دوباره این را اجرا کنیم و ببینیم چه
578
00:19:48,000 –> 00:19:49,679
اتفاقی میافتد،
579
00:19:49,679 –> 00:19:51,440
پس خیلی بیشتر طول میکشد،
580
00:19:51,440 –> 00:19:54,080
زیرا همه دادهها را
581
00:19:54,080 –> 00:19:56,960
میکشد، اما وقتی آمدید، بله، وقتی
582
00:19:56,960 –> 00:19:58,480
وارد اینجا
583
00:19:58,480 –> 00:20:01,039
شدید، میتوانید به سمت راست اسکرول کنید،
584
00:20:01,039 –> 00:20:01,919
بسیار مفید است
585
00:20:01,919 –> 00:20:05,360
. اینجوری ترجیح میدم من فقط میدونی که
586
00:20:05,360 –> 00:20:07,120
بیشتر مردم این کار رو انجام نمیدن اوه اکثر
587
00:20:07,120 –> 00:20:08,480
مردم این کار رو
588
00:20:08,480 –> 00:20:10,559
به صورت پیش فرض به این روش ندارند، بنابراین من فقط می خواستم
589
00:20:10,559 –> 00:20:12,240
به شما نشان دهم که چگونه می توانید
590
00:20:12,240 –> 00:20:15,120
آن را برطرف کنید تا اکنون
591
00:20:15,120 –> 00:20:15,600
برای
592
00:20:15,600 –> 00:20:18,720
بقیه پروژه
593
00:20:18,720 –> 00:20:22,640
بیایید ادامه دهیم. یک چیز
594
00:20:22,640 –> 00:20:24,240
مهم است وقتی
595
00:20:24,240 –> 00:20:25,360
با چیزی کار میکنید که
596
00:20:25,360 –> 00:20:26,400
مقادیر تهی ندارد، میخواهید
597
00:20:26,400 –> 00:20:27,760
مطمئن شوید که هیچ تکراری
598
00:20:27,760 –> 00:20:29,600
ندارید خیلی سریع ما فقط میخواهیم
599
00:20:29,600 –> 00:20:31,440
ببینیم اگر
600
00:20:31,440 –> 00:20:33,600
um داشته باشد اگر موارد تکراری وجود داشته باشد و ما
601
00:20:33,600 –> 00:20:34,799
آنها را رها کنیم
602
00:20:34,799 –> 00:20:36,799
بسیار آسان است، میخواهیم بگوییم اوم
603
00:20:36,799 –> 00:20:39,760
خوب در واقع بیایید بنویسیم
604
00:20:39,760 –> 00:20:44,000
که هر تکراری
605
00:20:44,000 –> 00:20:47,520
را حذف میکنیم، پس بیایید df را انجام دهیم.
606
00:20:47,520 –> 00:20:51,280
براکت باز را انجام دهید و می توانید این کار را
607
00:20:51,280 –> 00:20:53,520
در هر ستونی که می خواهید انجام دهید، می توانید این کار را
608
00:20:53,520 –> 00:20:54,799
روی چندین colu انجام دهید mns شما می توانید این کار را
609
00:20:54,799 –> 00:20:57,440
در کل کار انجام دهید
610
00:20:57,440 –> 00:21:00,960
و باید انجام دهید، اما چگونه این کار را انجام می
611
00:21:00,960 –> 00:21:05,200
دهید، می توانید بگویید که می دانید شرکت
612
00:21:05,200 –> 00:21:08,559
اوه ببخشید
613
00:21:08,559 –> 00:21:11,610
شرکت شما می توانید این کار را انجام دهید
614
00:21:11,610 –> 00:21:13,120
615
00:21:13,120 –> 00:21:16,480
زیر خط تکراری [Music] و
616
00:21:16,480 –> 00:21:20,640
مرتب سازی نقطه ای مقادیر زیر خط اوه
617
00:21:20,640 –> 00:21:23,679
مقادیر و می توانید بگویید
618
00:21:23,679 –> 00:21:27,679
ارسال کنید مساوی false است،
619
00:21:27,679 –> 00:21:29,440
بیایید خیلی سریع اجرا کنیم آه من چه
620
00:21:29,440 –> 00:21:31,200
گفتم مرتب سازی بر
621
00:21:31,200 –> 00:21:34,320
اساس مقادیر مرتب سازی نقطه ای
622
00:21:35,039 –> 00:21:39,039
اوه به این دلیل است که من اینطوری پیش
623
00:21:39,120 –> 00:21:42,400
نرفتم بد من، بنابراین قرار است
624
00:21:42,400 –> 00:21:44,960
ارزش ها را مرتب کند و اگر مقداری
625
00:21:44,960 –> 00:21:46,000
کاهش پیدا کرد به ما می گوید
626
00:21:46,000 –> 00:21:48,240
به نظر نمی رسد
627
00:21:48,240 –> 00:21:49,280
که ما
628
00:21:49,280 –> 00:21:51,679
هر تکراری را به درستی حذف می کنیم تا
629
00:21:51,679 –> 00:21:52,960
هیچ
630
00:21:52,960 –> 00:21:56,080
631
00:21:56,080 –> 00:22:00,320
شرکتی وجود نداشته
632
00:22:00,320 –> 00:22:02,480
باشد
633
00:22:02,480 –> 00:22:04,400
634
00:22:04,400 –> 00:22:06,799
635
00:22:06,799 –> 00:22:07,919
. من فقط خیلی سریع به شما نشان
636
00:22:07,919 –> 00:22:10,799
637
00:22:10,799 –> 00:22:12,640
میدهم، بنابراین میتوانم آنچه را که میخواهم بگویم را درک کنم،
638
00:22:12,640 –> 00:22:15,120
اگر از شر این مقادیر افت خلاص
639
00:22:15,120 –> 00:22:15,919
شویم، شروع به دیدن
640
00:22:15,919 –> 00:22:18,799
همه این سرگرمیهای zentropa میکنیم،
641
00:22:18,799 –> 00:22:20,159
هر چه باشد که
642
00:22:20,159 –> 00:22:22,000
چندین بار آن را میبینیم. بنابراین تنها
643
00:22:22,000 –> 00:22:23,440
کاری که انجام
644
00:22:23,440 –> 00:22:26,320
می دهد این است که نشان می دهد ما چه مقادیری در اینجا متمایز هستند
645
00:22:26,320 –> 00:22:27,840
646
00:22:27,840 –> 00:22:30,799
و اگر بخواهیم از شر آن خلاص شویم، میتوانیم
647
00:22:30,799 –> 00:22:31,679
انجام دهیم،
648
00:22:31,679 –> 00:22:34,640
شرکت df را میدانید و ما این کار
649
00:22:34,640 –> 00:22:35,520
را انجام نمیدهیم
650
00:22:35,520 –> 00:22:38,960
شرکت df برابر است و سپس این کار را انجام
651
00:22:38,960 –> 00:22:39,360
652
00:22:39,360 –> 00:22:40,480
میدهیم، آن را انجام نمیدهیم زیرا من
653
00:22:40,480 –> 00:22:42,080
نمیخواهم از شر همه آنهایی که در آنجا هستند خلاص شوم،
654
00:22:42,080 –> 00:22:42,799
اما
655
00:22:42,799 –> 00:22:44,640
اگر بخواهیم این کار را در
656
00:22:44,640 –> 00:22:47,200
تمام کارهایی که انجام میدهیم df company
657
00:22:47,200 –> 00:22:49,440
um یا فقط فریم دادهها انجام
658
00:22:49,440 –> 00:22:51,120
دهیم، نمیتوانیم هیچ کدام از آنها را انجام نمیدهیم، بنابراین فقط برای
659
00:22:51,120 –> 00:22:52,400
اینکه به شما نشان دهیم که چه چیزی است، اما ما
660
00:22:52,400 –> 00:22:55,280
این کار را انجام میدهیم
661
00:22:55,280 –> 00:22:57,520
و اگر میخواستیم این کار را انجام دهیم، میتوانستیم
662
00:22:57,520 –> 00:22:58,960
این کار را انجام دهیم، منظورم
663
00:22:58,960 –> 00:23:01,679
این است که هیچ نسخهای تکراری وجود ندارد، اما شما
664
00:23:01,679 –> 00:23:02,159
اجرا میکنید
665
00:23:02,159 –> 00:23:04,080
که هر تکراری را در
666
00:23:04,080 –> 00:23:06,840
کل قاب داده حذف میکند. این چیزی است که
667
00:23:06,840 –> 00:23:09,679
انجام می
668
00:23:09,679 –> 00:23:13,200
دهد، اجازه دهید خیلی سریع ادامه
669
00:23:13,200 –> 00:23:15,840
دهیم و چیز دیگری فقط با این
670
00:23:15,840 –> 00:23:16,400
671
00:23:16,400 –> 00:23:18,400
موضوع دلیلی برای اینکه ما همچنین می توانیم به
672
00:23:18,400 –> 00:23:21,520
این موضوع نگاه کنیم این است که ببینیم
673
00:23:21,520 –> 00:23:23,679
آیا در کیفیت واقعی داده ها مشکلی وجود دارد یا نه
674
00:23:23,679 –> 00:23:24,960
واقعاً به من اجازه می دهد به بالا برگردم
675
00:23:24,960 –> 00:23:27,039
زیرا اینجا یکی بود، فکر
676
00:23:27,039 –> 00:23:30,799
میکنم مثل برادران اخطار یا چیزی است که
677
00:23:31,600 –> 00:23:35,440
اجازه دهید ببینم که خیلی دور میشود
678
00:23:35,679 –> 00:23:38,960
بنابراین در اینجا واقعاً خوب است
679
00:23:38,960 –> 00:23:40,799
ما والت دیزنی داریم والت دیزنی والت
680
00:23:40,799 –> 00:23:43,120
دیزنی درست است که تعدادی از آنها
681
00:23:43,120 –> 00:23:44,960
وجود دارد که ممکن است لازم باشد هنگام
682
00:23:44,960 –> 00:23:47,360
تمیز کردن داده ها انجام دهید این است که در واقع
683
00:23:47,360 –> 00:23:49,440
همه اینها را جمع آوری کنید یا همه
684
00:23:49,440 –> 00:23:51,200
آنها را استاندارد کنید هر طور که می خواهید بگویید
685
00:23:51,200 –> 00:23:53,679
این همه شما هستید، من قبلاً به
686
00:23:53,679 –> 00:23:55,120
این موضوع نگاه کردهام و نیازی به انجام این کار نداریم، اما
687
00:23:55,120 –> 00:23:58,799
همه اینها شرکتهای متفاوتی هستند
688
00:23:58,799 –> 00:24:01,600
یا شرکتهایی در زمانهای مختلف بودهاند،
689
00:24:01,600 –> 00:24:02,320
درست است،
690
00:24:02,320 –> 00:24:05,200
بنابراین بیایید بگوییم که این یکی برای
691
00:24:05,200 –> 00:24:06,640
سالهای 1995
692
00:24:06,640 –> 00:24:08,799
تا 1980 و سپس بود. آنها نام را
693
00:24:08,799 –> 00:24:10,080
به این تغییر
694
00:24:10,080 –> 00:24:12,240
دادند، ما نمی خواهیم آن را استاندارد کنیم
695
00:24:12,240 –> 00:24:13,440
زیرا این دو
696
00:24:13,440 –> 00:24:15,039
بازه زمانی متمایز و دو
697
00:24:15,039 –> 00:24:16,799
شرکت متمایز هستند، اما اگر این یکی گفت
698
00:24:16,799 –> 00:24:18,240
مثلاً انیمیشن ویژگی والت دیزنی وجود دارد،
699
00:24:18,240 –> 00:24:18,960
700
00:24:18,960 –> 00:24:21,279
انیمیشن های ویژگی والت دیزنی با علامت
701
00:24:21,279 –> 00:24:22,480
s در در پایان،
702
00:24:22,480 –> 00:24:24,159
این یک اشتباه است و ما میخواهیم آن را
703
00:24:24,159 –> 00:24:26,080
تصحیح کنیم که خوشبختانه مجبور نیستیم این کار را انجام دهیم،
704
00:24:26,080 –> 00:24:28,640
زیرا این یک فرآیند بزرگ است،
705
00:24:28,640 –> 00:24:30,640
به من اعتماد کنید، من انجام دادهام و سخت است، بنابراین
706
00:24:30,640 –> 00:24:33,440
ما امروز این کار را انجام نمیدهیم،
707
00:24:33,440 –> 00:24:35,120
متشکرم برای خیابان
708
00:24:35,120 –> 00:24:38,559
709
00:24:38,559 –> 00:24:41,679
این یک دلیل اضافی است
710
00:24:41,679 –> 00:24:43,200
که چرا ما می خواستیم به
711
00:24:43,200 –> 00:24:45,200
این موضوع نگاه کنیم و چگونه به آن نگاه کردیم،
712
00:24:45,200 –> 00:24:48,080
اما شما همچنین می توانید موارد تکراری را رها کنید
713
00:24:48,080 –> 00:24:48,559
که
714
00:24:48,559 –> 00:24:50,240
به پاکسازی آن کمک می کند.
715
00:24:50,240 –> 00:24:51,919
چون نباید در اینجا موارد تکراری داشته باشید،
716
00:24:51,919 –> 00:24:53,360
717
00:24:53,360 –> 00:24:57,039
اما با این گفته من معتقدم
718
00:24:57,039 –> 00:24:59,279
که ما اکنون داده هایمان را همانطور که می خواهیم در اختیار داریم
719
00:24:59,279 –> 00:25:00,240
که
720
00:25:00,240 –> 00:25:02,080
فوق العاده است، من فکر می کنم که احتمالاً این
721
00:25:02,080 –> 00:25:04,320
بخش ساده تر
722
00:25:04,320 –> 00:25:07,279
از کاری است که ما انجام می دهیم.
723
00:25:07,279 –> 00:25:08,159
دادههایمان را
724
00:25:08,159 –> 00:25:10,080
داشته باشیم، شروع به بررسی
725
00:25:10,080 –> 00:25:12,480
متغیرها یا ستونهایی میکنیم
726
00:25:12,480 –> 00:25:15,520
و بیایید این را دوباره به سمت بالا بکشیم، اوه،
727
00:25:15,520 –> 00:25:17,120
728
00:25:17,120 –> 00:25:18,400
باید انجام میدادم، اجازه میدهم اجرا شود باید سر نقطه انجام میشد
729
00:25:18,400 –> 00:25:22,240
، اما اوم، میبینیم چه
730
00:25:22,240 –> 00:25:25,919
چیزهایی بیشتر به هم مرتبط هستند. اوه به این درآمد ناخالص
731
00:25:25,919 –> 00:25:27,200
732
00:25:27,200 –> 00:25:30,640
خوب است، بنابراین فرضیه من چه چیزی را
733
00:25:30,640 –> 00:25:31,200
باید
734
00:25:31,200 –> 00:25:34,320
بررسی کنم، بنابراین چون
735
00:25:34,320 –> 00:25:36,320
نگاه کردن به همه اینها سخت است نه سخت،
736
00:25:36,320 –> 00:25:38,000
زیرا ما آن
737
00:25:38,000 –> 00:25:41,039
را انجام خواهیم داد، رفتن و انجام یکی از آنها زمان می برد.
738
00:25:41,039 –> 00:25:43,360
زمانی است که همه اینها را با هم مقایسه
739
00:25:43,360 –> 00:25:46,400
کنم، بنابراین کارهایی را انجام خواهم داد که فکر
740
00:25:46,400 –> 00:25:48,720
میکنم به نتیجه برسد همبستگی بالایی داریم و سپس
741
00:25:48,720 –> 00:25:49,760
آن را آزمایش می کنیم و سپس
742
00:25:49,760 –> 00:25:50,240
743
00:25:50,240 –> 00:25:52,320
همه آنها را با هم بررسی می کنیم و به شما نشان می دهم
744
00:25:52,320 –> 00:25:54,240
که چگونه همه اینها را تجسم کنید
745
00:25:54,240 –> 00:25:56,960
و همه اینها را بنویسید، اما من معتقدم
746
00:25:56,960 –> 00:25:57,919
که
747
00:25:57,919 –> 00:26:00,080
این بودجه و من پیشبینیهایم را اینجا مینویسم.
748
00:26:00,080 –> 00:26:01,760
من معتقدم که
749
00:26:01,760 –> 00:26:02,640
بودجه همبستگی بالایی خواهد داشت
750
00:26:02,640 –> 00:26:04,240
. فکر میکنم هرچه
751
00:26:04,240 –> 00:26:05,440
پول بیشتری خرج کنند، پول بیشتری وارد
752
00:26:05,440 –> 00:26:06,320
خواهند کرد
753
00:26:06,320 –> 00:26:08,320
، این حدس من است که فکر میکنم
754
00:26:08,320 –> 00:26:09,440
بودجه به
755
00:26:09,440 –> 00:26:12,880
همبستگی بالایی دارند، من همچنین فکر می کنم که
756
00:26:12,880 –> 00:26:16,000
و شما می دانید که ممکن است این
757
00:26:16,000 –> 00:26:18,159
درست نباشد، فکر می کنم که این شرکت
758
00:26:18,159 –> 00:26:19,360
759
00:26:19,360 –> 00:26:21,840
نیز یک همبستگی تا حدودی بالا خواهد داشت
760
00:26:21,840 –> 00:26:23,200
.
761
00:26:23,200 –> 00:26:25,120
762
00:26:25,120 –> 00:26:27,360
763
00:26:27,360 –> 00:26:28,559
764
00:26:28,559 –> 00:26:31,679
فیلمهایی بسازید که پول زیادی به همراه داشته باشند،
765
00:26:31,679 –> 00:26:34,400
بنابراین فکر میکنم که شرکت
766
00:26:34,400 –> 00:26:39,679
um company همبستگی بالایی خواهد داشت،
767
00:26:39,679 –> 00:26:41,520
اجازه دهید بنویسم که این به نوعی
768
00:26:41,520 –> 00:26:43,200
حدس من است که اینها
769
00:26:43,200 –> 00:26:45,600
حدسهای آموزشی من هستند، آن را در فیلمنامههای خود قرار
770
00:26:45,600 –> 00:26:46,400
771
00:26:46,400 –> 00:26:48,080
ندهید. نیازی نیست که حدس من این است
772
00:26:48,080 –> 00:26:50,640
او همان چیزی است که من فکر میکنم اتفاق بیفتد،
773
00:26:50,640 –> 00:26:53,679
اما ما آن را درست آزمایش میکنیم، بنابراین
774
00:26:53,679 –> 00:26:56,640
یک کاری که میتوانیم خیلی سریع
775
00:26:56,640 –> 00:26:58,400
برای مقایسه بودجه
776
00:26:58,400 –> 00:27:01,760
و درآمد ناخالص انجام دهیم، انجام یک
777
00:27:01,760 –> 00:27:02,240
طرح پراکنده است،
778
00:27:02,240 –> 00:27:07,120
بنابراین بیایید یک طرح پراکنده بسازیم
779
00:27:07,120 –> 00:27:10,720
و بیایید مقایسه کنیم.
780
00:27:10,720 –> 00:27:14,640
بیایید یک طرح پراکندگی با بودجه در مقابل
781
00:27:14,640 –> 00:27:18,399
درآمد ناخالص انجام دهیم. کاری که میخواهیم انجام دهیم این
782
00:27:18,399 –> 00:27:21,120
است که همینجا برویم، میخواهیم
783
00:27:21,120 –> 00:27:21,679
بگوییم
784
00:27:21,679 –> 00:27:25,600
plt، بنابراین این پراکندگی نقطهای matplotlib ما است و این همان
785
00:27:25,600 –> 00:27:28,720
786
00:27:28,720 –> 00:27:29,919
طرح پراکندگی ما است که ما در مورد آن صحبت میکردیم.
787
00:27:29,919 –> 00:27:31,919
و ما میخواهیم بگوییم x
788
00:27:31,919 –> 00:27:34,720
برابر است و این این است که میدانید
789
00:27:34,720 –> 00:27:35,120
ما
790
00:27:35,120 –> 00:27:36,880
به چه دادههایی نگاه میکنیم، بنابراین این در
791
00:27:36,880 –> 00:27:38,799
محور x است، بنابراین میخواهیم بگوییم x
792
00:27:38,799 –> 00:27:41,120
برابر است با قاب داده و این
793
00:27:41,120 –> 00:27:41,919
794
00:27:41,919 –> 00:27:44,159
بودجه ما خواهد بود. بنابراین ما
795
00:27:44,159 –> 00:27:46,640
796
00:27:46,840 –> 00:27:48,960
دوباره می خواهیم بودجه های آپاستروف براکتی را انجام دهیم، من
797
00:27:48,960 –> 00:27:50,480
در مورد آن آپستروفی تردید می کنم، احساس
798
00:27:50,480 –> 00:27:51,200
می کنم اشت