در این مطلب، ویدئو کسب درآمد با آموزش پایتون – خراش دادن وب قسمت 1 | پایتون برای اسکات قسمت 3 با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:20:16
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:01,530
این قسمت سوم است و من فکر کردم که
2
00:00:01,530 –> 00:00:06,299
این بار آن را کاربردی تر کنم، بنابراین من
3
00:00:06,299 –> 00:00:08,130
در واقع برای کار به عنوان یک فریلنسر وارد سیستم
4
00:00:08,130 –> 00:00:09,660
شدم و فکر کردم می توانیم برای
5
00:00:09,660 –> 00:00:11,730
خودمان کارهایی پیدا کنیم و فقط می توانیم
6
00:00:11,730 –> 00:00:14,099
آنها را تکمیل کنیم و شاید حقوق بگیریم
7
00:00:14,099 –> 00:00:15,809
احتمالاً نه اگرچه آنها بادام زمینی مطلق می پردازند،
8
00:00:15,809 –> 00:00:17,550
اکثر مردم
9
00:00:17,550 –> 00:00:19,020
برای خراش های پایتون پنج دلار درخواست می کنند، مثل
10
00:00:19,020 –> 00:00:21,380
این است که بیا مثل این است که
11
00:00:21,380 –> 00:00:24,060
مردم این کار را درست انجام می دهند.
12
00:00:24,060 –> 00:00:26,580
13
00:00:26,580 –> 00:00:30,000
14
00:00:30,000 –> 00:00:32,070
15
00:00:32,070 –> 00:00:33,420
16
00:00:33,420 –> 00:00:35,940
این یک پروژه بسیار ساده است و
17
00:00:35,940 –> 00:00:37,920
به 200 وب سایت مختلف نیاز است، شاید
18
00:00:37,920 –> 00:00:39,629
آنها لیست بیشتری داشته باشند، ما به دنبال
19
00:00:39,629 –> 00:00:41,640
حذف داده های 200
20
00:00:41,640 –> 00:00:43,920
وب سایت دارایی و اضافه کردن داده ها به برگه های Google
21
00:00:43,920 –> 00:00:46,170
در یک قالب خاص هستیم و آنها ساعتی پرداخت می کنند.
22
00:00:46,170 –> 00:00:50,280
رتبه بندی داده ها و قالب
23
00:00:50,280 –> 00:00:52,219
بندی هر طرف به احتمال زیاد خانه متفاوت است،
24
00:00:52,219 –> 00:00:54,899
بنابراین ممکن است نیاز به خراش دادن دستی داشته باشد،
25
00:00:54,899 –> 00:00:56,940
بنابراین این یک کار ساده است که نیاز به
26
00:00:56,940 –> 00:00:59,160
خراش دادن دستی از 200 فرمت مختلف دارد،
27
00:00:59,160 –> 00:01:00,750
بله، ما EV نیستیم.
28
00:01:00,750 –> 00:01:02,420
29
00:01:02,420 –> 00:01:04,470
من به دنبال کسی هستم که
30
00:01:04,470 –> 00:01:06,030
بتواند حداقل 100 سوال را جمع آوری
31
00:01:06,030 –> 00:01:07,350
کند، خوب شاید باید
32
00:01:07,350 –> 00:01:11,430
اینجا جستجو کنیم چرا scraper را انجام نمی دهیم.
33
00:01:11,430 –> 00:01:13,080
34
00:01:13,080 –> 00:01:14,909
مردم اینترنت عاشق این هستند که مردم دوست دارند
35
00:01:14,909 –> 00:01:16,650
داده ها را از اینترنت دریافت کنند خوب بیایید
36
00:01:16,650 –> 00:01:20,400
نگاهی بیندازیم ما به دنبال یک وب سایت با تجربه هستیم
37
00:01:20,400 –> 00:01:21,509
که بتواند
38
00:01:21,509 –> 00:01:23,909
جزئیات و مشخصات خودروها را از یک
39
00:01:23,909 –> 00:01:25,530
وب سایت نمایندگی حذف کند و آن را در
40
00:01:25,530 –> 00:01:27,659
وب سایت وردپرس ما آپلود کند.
41
00:01:27,659 –> 00:01:29,159
دقت مطمئناً دقیق خواهد بود،
42
00:01:29,159 –> 00:01:33,150
مستقیم از آنجا خوب است، خوب بیایید
43
00:01:33,150 –> 00:01:34,740
نگاه کنیم، لطفاً زمان تخمین زدن
44
00:01:34,740 –> 00:01:36,890
25 اتومبیل را از اطلاعات
45
00:01:36,890 –> 00:01:40,520
وب سایت پورشه ون کوگار ارائه دهید، خوب است
46
00:01:40,520 –> 00:01:43,020
به دنبال یک متخصص باشید که ما می توانیم
47
00:01:43,020 –> 00:01:45,119
این کار را انجام دهیم و آنها باید دو فریلنسر استخدام کنند.
48
00:01:45,119 –> 00:01:47,460
و من باید آن را در وردپرس آپلود کنم،
49
00:01:47,460 –> 00:01:49,649
همه چیزهای بسیار ساده،
50
00:01:49,649 –> 00:01:53,549
اما برخی بیایید دست به کار شویم، بنابراین
51
00:01:53,549 –> 00:01:55,140
کاری که ما میخواهیم انجام دهیم این است
52
00:01:55,140 –> 00:01:58,170
که یک پنجره کوچک تازه ایجاد کنیم.
53
00:01:58,170 –> 00:01:59,430
این یکی از نظر ظاهری که حتی یک فایل آدرس وب نیست،
54
00:01:59,430 –> 00:02:01,950
خوب است،
55
00:02:01,950 –> 00:02:03,869
پس آن را در اینجا قرار دهید
56
00:02:03,869 –> 00:02:06,930
مرکز پشتیبانی پورشه ونکوور کانادا و آنها می
57
00:02:06,930 –> 00:02:08,489
خواهند اساساً همه این ماشین ها را خراش دهند و
58
00:02:08,489 –> 00:02:10,848
من همه جزئیات آنها را حدس می زنم،
59
00:02:10,848 –> 00:02:12,900
خوب این چند راه برای رویکرد
60
00:02:12,900 –> 00:02:13,530
این
61
00:02:13,530 –> 00:02:15,060
یکی این است که نگاهی به
62
00:02:15,060 –> 00:02:16,590
جلوی صفحه تا جلوی
63
00:02:16,590 –> 00:02:20,730
وبسایت بیندازید و فقط دادهها
64
00:02:20,730 –> 00:02:24,120
را به روشی دیگر حذف کنید، در واقع نگاهی به
65
00:02:24,120 –> 00:02:25,500
ترافیک شبکه بیندازید، بنابراین اجازه دهید ادامه دهم و به
66
00:02:25,500 –> 00:02:27,300
کجا نگاه میکنیم. صفحه کلید من
67
00:02:27,300 –> 00:02:30,870
روی دوربین نیست، خوب، بیایید جلو برویم و
68
00:02:30,870 –> 00:02:33,450
فشار دهیم ما در Google Chrome هستیم،
69
00:02:33,450 –> 00:02:36,600
f12 را فشار می دهیم، به شبکه می رویم و
70
00:02:36,600 –> 00:02:38,970
آنچه در واقع اینجا است،
71
00:02:38,970 –> 00:02:40,770
نوعی کنسول توسعه دهنده ما است و در
72
00:02:40,770 –> 00:02:42,780
واقع به دنبال آن است.
73
00:02:42,780 –> 00:02:44,310
نوع ترافیک شبکه، بنابراین به همه اینها نگاه کنید فقط
74
00:02:44,310 –> 00:02:46,320
فیلترها در قسمت پایینی هستند، اینجا فقط اطلاعاتی را
75
00:02:46,320 –> 00:02:48,030
جمع آوری می کند، بنابراین وقتی برای
76
00:02:48,030 –> 00:02:49,920
اولین بار به وب سایت مراجعه کردم، چه کاری انجام می دهیم این است
77
00:02:49,920 –> 00:02:52,260
که این را پاک می کنیم و دوباره به وب سایت ضربه می زنیم،
78
00:02:52,260 –> 00:02:55,580
79
00:02:55,580 –> 00:02:58,319
بازخوانی خوب است. پا بسیار خوب به نظر می رسد
80
00:02:58,319 –> 00:02:59,970
در کل این ترافیک چیزهای زیادی است
81
00:02:59,970 –> 00:03:02,430
و نوع ترافیک شبکه ای که
82
00:03:02,430 –> 00:03:06,540
در واقع به آن علاقه مند بود XH است که
83
00:03:06,540 –> 00:03:09,209
معمولاً یک تماس API است که گاهی اوقات
84
00:03:09,209 –> 00:03:11,910
به عنوان Ajax شناخته می شود و شما کاملاً در
85
00:03:11,910 –> 00:03:13,200
تمام اصطلاحات مختلف برای
86
00:03:13,200 –> 00:03:15,540
موارد اینترنتی نمی دانید، اما می توانید در اینجا یک توییتر را ببینید.
87
00:03:15,540 –> 00:03:17,220
چیزی در جریان است و اطلاعاتی در
88
00:03:17,220 –> 00:03:19,829
آنجا وجود دارد، اما در نهایت اگر شروع به کلیک کردن کردم،
89
00:03:19,829 –> 00:03:22,230
اجازه دهید نگاهی بیندازیم، بنابراین بیایید
90
00:03:22,230 –> 00:03:28,530
این Boxster Boxster Boxster را انتخاب کنیم که به وضوح
91
00:03:28,530 –> 00:03:33,600
یک شخص پورشه نیست، فقط روی چیزهایی کلیک می کنم، من
92
00:03:33,600 –> 00:03:35,760
نمی توانم روی شما کلیک کنم خالی شما
93
00:03:35,760 –> 00:03:37,850
جستجوی بازدیدها جستجو کنید
94
00:03:37,850 –> 00:03:40,140
هیچ چیز واقعاً ظاهر نمی شود که عالی نیست
95
00:03:40,140 –> 00:03:41,220
96
00:03:41,220 –> 00:03:44,570
مقدس آنها ارزان نیستند آنها
97
00:03:44,570 –> 00:03:46,739
124000 دلار کانادا هستند حتی نمی دانم
98
00:03:46,739 –> 00:03:48,239
ارزش دلار کانادا چقدر است اما
99
00:03:48,239 –> 00:03:50,250
بیایید نگاهی بیندازیم به آنچه باز می گردد
100
00:03:50,250 –> 00:03:52,170
می گوید این یک چیز فیس بوک است.
101
00:03:52,170 –> 00:03:54,780
تنظیمات اینجا ما می رویم پورشه ونکوور
102
00:03:54,780 –> 00:03:59,700
API فیلترهای موجودی موجودی داده های دکتری داده های
103
00:03:59,700 –> 00:04:04,350
پورشه برابر است با 1 داده های خوب برابر
104
00:04:04,350 –> 00:04:06,000
است یک مالک جالب وجود دارد
105
00:04:06,000 –> 00:04:07,950
داده ها برابر است بیایید بفهمیم نقطه برابر است
106
00:04:07,950 –> 00:04:12,930
با اجازه این کار را انجام داد من فکر
107
00:04:12,930 –> 00:04:15,239
می کنم 41 داده نزدیک است
108
00:04:15,239 –> 00:04:20,190
و داده ها هنوز هم یک عدد بد بود،
109
00:04:20,190 –> 00:04:21,659
خوب اجازه دهید فقط به پیش نمایش نگاهی بیندازیم
110
00:04:21,659 –> 00:04:25,010
اوه این فیلترهای خوب است که استفاده نکرده
111
00:04:25,010 –> 00:04:27,270
ام فیلترهایی که من استفاده
112
00:04:27,270 –> 00:04:30,599
کرده ام خوب است بدانید من واقعاً
113
00:04:30,599 –> 00:04:32,819
از این چیز خوبی به دست نمیآورم،
114
00:04:32,819 –> 00:04:34,440
اما این یک نگاه کوچک است.
115
00:04:34,440 –> 00:04:35,639
116
00:04:35,639 –> 00:04:39,449
117
00:04:39,449 –> 00:04:42,419
118
00:04:42,419 –> 00:04:43,949
به دنبال این است که بگوییم
119
00:04:43,949 –> 00:04:45,360
مثلاً ماشینی در اینجا وجود دارد که ما آن را کپی میکنیم و
120
00:04:45,360 –> 00:04:47,729
من به طور تصادفی روی آن کلیک کردم
121
00:04:47,729 –> 00:04:50,009
، در واقع میتوانم مفید
122
00:04:50,009 –> 00:04:52,979
باشم، نه ما آن را نمیخواهیم و فقط
123
00:04:52,979 –> 00:04:55,319
من وارد صفحه یک موجودی صفحه دوم شدم.
124
00:04:55,319 –> 00:04:57,509
بنابراین این یک صفحه است که خوب است، بنابراین
125
00:04:57,509 –> 00:05:00,509
در URL است که خوب است و چیزی که من
126
00:05:00,509 –> 00:05:01,919
واقعاً به دنبال آن هستم این است که
127
00:05:01,919 –> 00:05:03,479
ببینم آیا این داده ها در یک
128
00:05:03,479 –> 00:05:06,060
قالب واقعاً ساختاریافته وارد می شوند یا خیر آنچه به نظر می
129
00:05:06,060 –> 00:05:08,759
رسد این درخواست دریافت است. به
130
00:05:08,759 –> 00:05:12,240
این نقطه پایانی فیلتر می شود که اساساً
131
00:05:12,240 –> 00:05:13,669
فیلترهایی را که اعمال کرده اید برمی گرداند
132
00:05:13,669 –> 00:05:15,960
ما در اینجا تنظیماتی
133
00:05:15,960 –> 00:05:17,250
داریم که واقعاً هیچ چیز از آن بیرون نمیآید و من این
134
00:05:17,250 –> 00:05:21,060
کمی جاوا اسکریپت دارم که
135
00:05:21,060 –> 00:05:25,080
نگهبانی بسیار گیج کننده در آن است، اما کاری که
136
00:05:25,080 –> 00:05:28,610
من انجام دادم این است که یک
137
00:05:28,610 –> 00:05:31,680
چیز خاص مانند ماشین را کپی کردهام. پس بیایید
138
00:05:31,680 –> 00:05:34,259
جلوتر برویم و ctrl F را بدهیم و ببینیم که آیا
139
00:05:34,259 –> 00:05:37,259
میتوان آن را فیلتر کرد یا نه. من به اینجا آمدم سنگ
140
00:05:37,259 –> 00:05:38,280
در این صفحه دیگر
141
00:05:38,280 –> 00:05:40,020
142
00:05:40,020 –> 00:05:44,789
143
00:05:44,789 –> 00:05:48,060
مشکلی ندارد و بنابراین چیزی که ما به دنبال آن هستیم این است که بله، بعد از بخش 2019 میرویم تا آنجا که وجود دارد خوب است. من می توانم
144
00:05:48,060 –> 00:05:51,650
بگویم که مقدار زیادی از
145
00:05:51,650 –> 00:05:54,900
چیزهای نقطه پایانی API وجود ندارد، بنابراین ما
146
00:05:54,900 –> 00:05:57,509
باید به مسیر سخت تری برویم که
147
00:05:57,509 –> 00:05:59,370
استفاده از بسته خراش وب به نام
148
00:05:59,370 –> 00:05:59,969
beautifulsoup است،
149
00:05:59,969 –> 00:06:02,789
بنابراین بیایید ادامه دهیم و این کار را انجام دهیم تا
150
00:06:02,789 –> 00:06:05,969
این صفحه را داشته باشیم. کاری
151
00:06:05,969 –> 00:06:08,310
که ممکن است انجام دهیم بسیار خوب است این است که ممکن است در واقع
152
00:06:08,310 –> 00:06:13,199
به رفرش f12 خود برگردیم، این
153
00:06:13,199 –> 00:06:15,000
کاری که میخواهیم انجام دهیم این است که در واقع
154
00:06:15,000 –> 00:06:17,880
اولین تماسی را که انجام دادیم نگاه کنیم و به
155
00:06:17,880 –> 00:06:19,169
برخی از جزئیات آنها نگاه کنیم، برای دریافت
156
00:06:19,169 –> 00:06:22,020
درخواستها در صفحه که خوب است
157
00:06:22,020 –> 00:06:23,630
کمی سریع از پس زمینه شما نیز به دلیل داشتن
158
00:06:23,630 –> 00:06:26,460
هدر او تبلیغکنندگان شامل
159
00:06:26,460 –> 00:06:29,219
اطلاعات مهمی مانند رمزگذاری
160
00:06:29,219 –> 00:06:31,110
زبان، مجموعهای از موارد دیگر مانند
161
00:06:31,110 –> 00:06:33,449
کوکیها به طور بالقوه مانند معمول هستند و
162
00:06:33,449 –> 00:06:35,130
مهمترین آنها برای ما عامل کاربر ما است
163
00:06:35,130 –> 00:06:36,930
که در اینجا قرار دارد و اساساً به ما میگوید
164
00:06:36,930 –> 00:06:37,990
هی ما هستیم
165
00:06:37,990 –> 00:06:39,850
یا یک شخص، اما ما نیستیم. دوباره
166
00:06:39,850 –> 00:06:42,039
وبسایت او را خراش میدهم و کاری که من انجام میدهم این است که
167
00:06:42,039 –> 00:06:44,560
معمولاً کپی میکنم و به صورت کرل کپی
168
00:06:44,560 –> 00:06:46,900
میکنم و سپس از این وبسایت کوچک و مرتب استفاده میکنم
169
00:06:46,900 –> 00:06:49,870
که یک درخواست curl را که
170
00:06:49,870 –> 00:06:51,460
شبیه درخواست سمت چپ به نظر میرسد به یک
171
00:06:51,460 –> 00:06:53,800
درخواست پایتون با فرمت بسیار زیبا تبدیل میکند.
172
00:06:53,800 –> 00:06:57,430
یک شاهکار واقعاً جالب است که یک
173
00:06:57,430 –> 00:07:00,009
پیوند در توضیحات اضافه کنید، بنابراین بیایید ادامه دهیم
174
00:07:00,009 –> 00:07:04,199
و در واقع یک سند جدید راه
175
00:07:04,199 –> 00:07:07,660
اندازی کنیم، بنابراین
176
00:07:07,660 –> 00:07:09,610
اگر برای من منطقی باشد، نام آن را زای پشتو
177
00:07:09,610 –> 00:07:13,000
بگذاریم و بدیهی است که ما خودمان را خواهیم داشت. مردی
178
00:07:13,000 –> 00:07:15,400
اینجا که دارد کالاهایی را که قرار است این کالا
179
00:07:15,400 –> 00:07:17,530
باشد را رها می کند، اوه این بزرگ است،
180
00:07:17,530 –> 00:07:20,080
خوب پس ما واقعاً اینجا چه چیزی می بینیم،
181
00:07:20,080 –> 00:07:21,130
بنابراین ما یک دسته کل
182
00:07:21,130 –> 00:07:23,020
کوکی داریم، من در واقع فعلاً نگران آنها نیستم.
183
00:07:23,020 –> 00:07:25,389
واقعا مهم است
184
00:07:25,389 –> 00:07:26,889
nt در وب سایت ممکن است مسدود شود
185
00:07:26,889 –> 00:07:29,110
اگر ما از آنها استفاده نکنیم اما در اینجا با
186
00:07:29,110 –> 00:07:31,509
اتصال به خدا بله این همه صفحه خوب
187
00:07:31,509 –> 00:07:33,190
برابر است با یک به زیبایی زیرا می توانیم
188
00:07:33,190 –> 00:07:35,500
یک صفحه دو سه چهار و غیره را تکرار کنیم.
189
00:07:35,500 –> 00:07:37,509
190
00:07:37,509 –> 00:07:39,280
همچنین
191
00:07:39,280 –> 00:07:42,490
در URL گنجانده شود و گاهی اوقات
192
00:07:42,490 –> 00:07:44,440
در واقع بهتر است زیرا به شکل
193
00:07:44,440 –> 00:07:46,599
عجیبی قالب بندی شده است و ما از کوکی ها استفاده نمی کنیم از
194
00:07:46,599 –> 00:07:49,659
شر آنها خلاص شویم و
195
00:07:49,659 –> 00:07:51,520
فقط این چیز کوچک را در اینجا به او می دهیم
196
00:07:51,520 –> 00:07:53,949
shift enter بنابراین درخواست واردات ما با
197
00:07:53,949 –> 00:07:55,090
شما تماس گرفتیم بوم بوم بوم
198
00:07:55,090 –> 00:07:56,889
یک واقعیت جالب در مورد
199
00:07:56,889 –> 00:07:58,900
بسته درخواست در واقع بر اساس URL
200
00:07:58,900 –> 00:08:01,419
201
00:08:01,419 –> 00:08:03,430
202
00:08:03,430 –> 00:08:05,440
203
00:08:05,440 –> 00:08:07,270
204
00:08:07,270 –> 00:08:10,349
شما است. “قرار است استفاده کنم، پس
205
00:08:10,349 –> 00:08:13,419
بیایید ادامه دهیم و به پاسخ
206
00:08:13,419 –> 00:08:17,340
شماره 200 نگاه کنیم که وب سایت خوبی است که برگردانده شده است
207
00:08:17,340 –> 00:08:19,990
و سپس آنچه که ما نیز به آن نگاه می کنیم این است
208
00:08:19,990 –> 00:08:22,030
که مقداری از آن را به من بدهید آنچه در
209
00:08:22,030 –> 00:08:23,590
داخل پاسخ ها وجود دارد. خوب پس
210
00:08:23,590 –> 00:08:26,199
ما به متن نگاه می کنیم و این فقط
211
00:08:26,199 –> 00:08:31,210
HTML است و یک شی رشته ای است
212
00:08:31,210 –> 00:08:34,299
که قابل
213
00:08:34,299 –> 00:08:37,149
فراخوانی نیست.
214
00:08:37,149 –> 00:08:39,010
215
00:08:39,010 –> 00:08:40,690
این کمی بالا است، بنابراین
216
00:08:40,690 –> 00:08:43,208
یک سلول دیگر را به اینجا اضافه کنید، من به اینجا می روم، ما
217
00:08:43,208 –> 00:08:44,529
درخواست را در آنجا قرار
218
00:08:44,529 –> 00:08:45,160
219
00:08:45,160 –> 00:08:46,750
220
00:08:46,750 –> 00:08:49,510
می دهیم.
221
00:08:49,510 –> 00:08:51,200
بسته ای به نام BS
222
00:08:51,200 –> 00:08:53,690
برای اساساً وجود دارد و در داخل
223
00:08:53,690 –> 00:08:54,860
کلاس به نام کت و شلوار زیبا وجود دارد، فکر می کنم
224
00:08:54,860 –> 00:08:56,330
ساختار آن اینگونه است، اما
225
00:08:56,330 –> 00:08:57,680
کت و شلوارهای زیبا از آبجو برای واردات هستند
226
00:08:57,680 –> 00:08:59,150
سوپ زیبا این اولین
227
00:08:59,150 –> 00:09:00,530
مصاحبه شما برای سوپ است که حتی
228
00:09:00,530 –> 00:09:02,540
در مورد آن چیز زیادی نمی دانید این بدان معنی است که
229
00:09:02,540 –> 00:09:03,830
شما باید آن داده های ساختاریافته را از
230
00:09:03,830 –> 00:09:05,960
وب سایت دریافت می کنید و شروع به ایجاد برخی
231
00:09:05,960 –> 00:09:08,270
هزینه های CS می کند، بنابراین ما کجا هستیم تا
232
00:09:08,270 –> 00:09:10,460
درخواست ها را با سوپ زیبا دریافت
233
00:09:10,460 –> 00:09:12,830
کنیم سپس سوپی ایجاد می کنیم که
234
00:09:12,830 –> 00:09:14,870
تقریباً HTML را در آن تجزیه می کند.
235
00:09:14,870 –> 00:09:17,060
ساختار سوپ زیبا
236
00:09:17,060 –> 00:09:19,310
که واقعاً درست است بنابراین به ما اجازه میدهد تا
237
00:09:19,310 –> 00:09:21,560
در صفحات وب واقعی
238
00:09:21,560 –> 00:09:23,150
مرتبسازی کنیم، اگر نقاط دادهای بسیار
239
00:09:23,150 –> 00:09:25,670
شبیه به یک فرهنگ لغت در پایتون بود، بنابراین
240
00:09:25,670 –> 00:09:27,860
بیایید ادامه دهیم و اکنون این کار را انجام دهیم، بنابراین آنچه که
241
00:09:27,860 –> 00:09:30,020
میخواهیم بگوییم این است که آن را صدا میزنیم. مدارس
242
00:09:30,020 –> 00:09:32,270
نام آن را سوپ
243
00:09:32,270 –> 00:09:34,070
می گذارند و سوپ برابر است، بیایید یک لحظه به این موضوع فکر کنیم
244
00:09:34,070 –> 00:09:37,790
و شما سوپ زیبایی را می شناسید و
245
00:09:37,790 –> 00:09:41,180
این HTML ما خواهد بود، اما ما باید
246
00:09:41,180 –> 00:09:43,070
در واقع یک تجزیه کننده تعریف کنیم و اکنون به عنوان
247
00:09:43,070 –> 00:09:44,600
چند مورد برای انتخاب از بین آنها معمولا
248
00:09:44,600 –> 00:09:46,520
بهطور پیشفرض در تجزیهکننده HTML،
249
00:09:46,520 –> 00:09:47,990
میتوانید موارد مختلفی را جستجو
250
00:09:47,990 –> 00:09:49,010
کنید که میتوانید در صورت استفاده از
251
00:09:49,010 –> 00:09:50,870
دادههای XML استفاده کنید.
252
00:09:50,870 –> 00:09:53,020
253
00:09:53,020 –> 00:09:55,310
254
00:09:55,310 –> 00:09:57,260
پایتون احتمالاً بیش
255
00:09:57,260 –> 00:10:00,350
از هر زمان معینی چندین ده
256
00:10:00,350 –> 00:10:03,050
روش مختلف برای انجام کاری به یک روش
257
00:10:03,050 –> 00:10:05,210
دارد، جوانب مثبت و منفی و غیره دارد و ممکن است
258
00:10:05,210 –> 00:10:07,160
همیشه در هر سناریویی کار کند، اما بسیاری
259
00:10:07,160 –> 00:10:08,330
از افراد وقتی روشی را پیدا میکنند که
260
00:10:08,330 –> 00:10:09,680
با شما راحت هستند. متوجه خواهند شد
261
00:10:09,680 –> 00:10:11,240
که به استفاده از آن ادامه خواهند داد بنابراین اگر
262
00:10:11,240 –> 00:10:13,220
فردی هستید که به نوعی در URL
263
00:10:13,220 –> 00:10:14,810
زنده بزرگ شده اید و از آن برای دریافت وب سایت استفاده
264
00:10:14,810 –> 00:10:16,160
می کنید، احتمالاً به استفاده از آن ادامه خواهید داد.
265
00:10:16,160 –> 00:10:18,470
266
00:10:18,470 –> 00:10:19,820
267
00:10:19,820 –> 00:10:21,770
درخواست جایی است که من فرود میآیم و این
268
00:10:21,770 –> 00:10:23,180
همان چیزی است که من دوست دارم از
269
00:10:23,180 –> 00:10:25,550
تجزیهکنندههای HTML مشابه و زیبا استفاده کنم، پس
270
00:10:25,55