در این مطلب، ویدئو خراش دادن Google News به روشی آسان با پایتون و pygooglenews با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:12:04
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,240 –> 00:00:01,839
بنابراین دلایل زیادی وجود دارد که چرا ممکن
2
00:00:01,839 –> 00:00:03,919
است بخواهید اخبار را حذف کنید و کجا بهتر
3
00:00:03,919 –> 00:00:04,400
4
00:00:04,400 –> 00:00:06,480
از گوگل بروید، فکر می کنم ما برای
5
00:00:06,480 –> 00:00:08,160
هر چیز دیگری به آنجا می رویم، پس چرا این یکی نباشد
6
00:00:08,160 –> 00:00:10,639
و امروز روزی برای ما در بریتانیا است
7
00:00:10,639 –> 00:00:11,840
که در آن ما بقیه چیزهای خود را فهمیدیم.
8
00:00:11,840 –> 00:00:14,000
برنامههای قرنطینه بله، ما هنوز قفل شدهایم
9
00:00:14,000 –> 00:00:14,639
10
00:00:14,639 –> 00:00:17,039
و شما نمیتوانید بهطور واقعبینانه کاری انجام دهید،
11
00:00:17,039 –> 00:00:18,960
بنابراین ما هیجانزده شدیم که متوجه این موضوع
12
00:00:18,960 –> 00:00:20,240
شدیم، من به این فکر
13
00:00:20,240 –> 00:00:22,640
کردم که احتمالاً میتوانیم راه خوبی برای
14
00:00:22,640 –> 00:00:24,560
خراش دادن سایت خبری گوگل داشته باشیم و میتوانیم
15
00:00:24,560 –> 00:00:27,119
نوعی واقعی ایجاد کنیم. فید سفارشی یا
16
00:00:27,119 –> 00:00:28,320
تجمیع آن یا
17
00:00:28,320 –> 00:00:30,800
شاید حتی تجزیه و تحلیل روی آن یا
18
00:00:30,800 –> 00:00:31,359
چیزی انجام دهم،
19
00:00:31,359 –> 00:00:32,800
بنابراین فکر کردم این ویدیو را ایجاد کنم تا به
20
00:00:32,800 –> 00:00:34,320
شما دوستان نشان دهم چگونه می توانید وب سایت اخبار گوگل را خراش دهید،
21
00:00:34,320 –> 00:00:35,760
22
00:00:35,760 –> 00:00:37,760
بنابراین این اینجاست و اولین کاری که
23
00:00:37,760 –> 00:00:39,520
می خواهید انجام دهید این است که سعی نکنید این صفحه را خراش دهید
24
00:00:39,520 –> 00:00:40,399
25
00:00:40,399 –> 00:00:42,719
زیرا به جایی نخواهید رسید که
26
00:00:42,719 –> 00:00:44,160
ممکن است کار کند، اما
27
00:00:44,160 –> 00:00:46,160
کند خواهد بود و سخت خواهد بود، بنابراین کاری که می خواهید انجام دهید این
28
00:00:46,160 –> 00:00:47,200
است که می خواهید به
29
00:00:47,200 –> 00:00:50,559
این آدرس اینترنتی اینجا بیایید. آن را در
30
00:00:50,559 –> 00:00:51,520
زیر برای شما پیوند دهید،
31
00:00:51,520 –> 00:00:53,760
اما اساساً من یک عبارت جستجوی او ایجاد کرده ام
32
00:00:53,760 –> 00:00:55,440
که به آن قفل میگویند
33
00:00:55,440 –> 00:00:57,199
و چون میداند من از بریتانیا
34
00:00:57,199 –> 00:00:59,199
هستم، اکنون نتایج انگلستان را میگیرم،
35
00:00:59,199 –> 00:01:02,320
این همه
36
00:01:02,320 –> 00:01:03,840
موارد است، فکر میکنم یادم نمیآید چند مورد وجود دارد، اما
37
00:01:03,840 –> 00:01:04,959
تعداد کمی
38
00:01:04,959 –> 00:01:08,080
از آخرین موارد وجود دارد. اخباری از
39
00:01:08,080 –> 00:01:08,960
گوگل که با اینجا مطابقت دارند،
40
00:01:08,960 –> 00:01:11,920
بنابراین کاری که میتوانیم انجام دهیم این است که میتوانیم
41
00:01:11,920 –> 00:01:13,360
این آدرس اینترنتی را کپی کنیم،
42
00:01:13,360 –> 00:01:15,360
من میخواهم بیت پایانی و
43
00:01:15,360 –> 00:01:17,200
فقط بیتی که نیاز به کپی
44
00:01:17,200 –> 00:01:18,799
دارم را حذف کنیم و به کد خود بیایم و
45
00:01:18,799 –> 00:01:20,320
ما می خواهیم از uh
46
00:01:20,320 –> 00:01:23,439
request.html برای این کار استفاده کنیم و
47
00:01:23,439 –> 00:01:26,080
ما می خواهیم بگوییم که
48
00:01:26,080 –> 00:01:29,680
از درخواست ها تاکید می کنیم جلسه html واردات html را تاکید می
49
00:01:29,680 –> 00:01:33,280
کنیم زیرا ما همیشه
50
00:01:33,280 –> 00:01:34,960
می خواهیم از یک شی جلسه استفاده
51
00:01:34,960 –> 00:01:36,880
کنیم اگر شما نمی دانید این
52
00:01:36,880 –> 00:01:38,159
چیست. یک ویدیو در مورد جلسات و اینکه چرا
53
00:01:38,159 –> 00:01:39,360
باید از آنها استفاده کنید، بنابراین باید بروید بررسی کنید
54
00:01:39,360 –> 00:01:40,720
که من یک پیوند را در زیر
55
00:01:40,720 –> 00:01:41,520
برای شما می گذارم،
56
00:01:41,520 –> 00:01:43,600
بنابراین ما می خواهیم بگوییم آدرس اینترنتی ما همان چیزی است که
57
00:01:43,600 –> 00:01:45,119
من اینجا گفتم، اکنون می توانید ببینید که
58
00:01:45,119 –> 00:01:46,720
ما این را
59
00:01:46,720 –> 00:01:48,799
به جستجو و صف برای
60
00:01:48,799 –> 00:01:50,320
پرس و جو تقسیم کردم و من
61
00:01:50,320 –> 00:01:51,840
قفلی را قرار دادم که می خواهم در
62
00:01:51,840 –> 00:01:54,159
آنجا بگذارم اکنون می توانیم بگوییم
63
00:01:54,159 –> 00:01:57,360
s برابر با جلسه html ما است
64
00:01:57,360 –> 00:01:59,759
و ما می خواهیم انجام دهیم r برابر است با s
65
00:01:59,759 –> 00:02:02,399
dot get
66
00:02:02,560 –> 00:02:05,040
و اگر من فقط r.html.h را چاپ کنم آدرس اینترنتی خود را انجام می دهیم
67
00:02:05,040 –> 00:02:05,840
68
00:02:05,840 –> 00:02:09,360
69
00:02:09,360 –> 00:02:12,080
که باید همه داده ها را در آنجا به ما بدهد.
70
00:02:12,080 –> 00:02:13,360
میتوانیم ببینیم که کار میکند و
71
00:02:13,360 –> 00:02:14,800
همه این اطلاعات را به دست آوردهایم،
72
00:02:14,800 –> 00:02:16,879
بنابراین فقط باید اکنون از آن عبور کنیم، بنابراین
73
00:02:16,879 –> 00:02:19,360
برای دریافت عناوین، میگویم بیایید
74
00:02:19,360 –> 00:02:20,160
برای
75
00:02:20,160 –> 00:02:24,959
عنوان در r.html.find انجام دهیم
76
00:02:24,959 –> 00:02:29,440
و فکر میکنم که این کار میکند.
77
00:02:29,440 –> 00:02:33,840
ما فقط میتوانیم
78
00:02:33,840 –> 00:02:37,519
متن نقطه عنوان را چاپ کنیم و آن را اجرا
79
00:02:37,519 –> 00:02:39,360
کنیم و همه عناوین را برگردانیم، بنابراین میتوانیم
80
00:02:39,360 –> 00:02:40,720
همه آنها را در اینجا ببینیم،
81
00:02:40,720 –> 00:02:42,640
اکنون میتوانید این کار را برای هر بخش دیگر
82
00:02:42,640 –> 00:02:44,400
از اطلاعات انجام دهید،
83
00:02:44,400 –> 00:02:46,560
اما این باعث شد به این فکر کنم که
84
00:02:46,560 –> 00:02:48,400
دسترسی به آن بسیار آسان است.
85
00:02:48,400 –> 00:02:51,599
باید راه بهتری وجود داشته باشد
86
00:02:51,599 –> 00:02:54,160
و البته کسی قبلاً
87
00:02:54,160 –> 00:02:56,080
بسته پایتون خود را ساخته است که
88
00:02:56,080 –> 00:02:59,040
همیشه اتفاق می افتد و اعتباری برای
89
00:02:59,040 –> 00:03:00,319
این شخص وجود دارد، بنابراین من فقط می خواهم همه اینها را حذف
90
00:03:00,319 –> 00:03:01,920
کنم زیرا به آن نیاز نداریم
91
00:03:01,920 –> 00:03:05,200
. من می خواهم از این اینجا استفاده کنم،
92
00:03:05,200 –> 00:03:08,239
بنابراین صفحه github را در اینجا باز کرده ام و
93
00:03:08,239 –> 00:03:08,959
94
00:03:08,959 –> 00:03:11,120
تمام راه را به بالا و اعتبار می دهم به
95
00:03:11,120 –> 00:03:12,159
این
96
00:03:12,159 –> 00:03:14,400
پسر که آن را به github و لینک github خود ساخته است،
97
00:03:14,400 –> 00:03:15,280
98
00:03:15,280 –> 00:03:17,280
من قبلاً این را نصب کردهام،
99
00:03:17,280 –> 00:03:18,800
همین یک دقیقه پیش داشتم با آن بازی میکردم،
100
00:03:18,800 –> 00:03:20,319
اما جدا از آن، این
101
00:03:20,319 –> 00:03:22,319
برای من نیز کاملاً تازه است،
102
00:03:22,319 –> 00:03:24,319
بنابراین میتوانید ما را ببینید. نصب مجدد پیپ در اینجا
103
00:03:24,319 –> 00:03:25,519
من قبلاً این کار را انجام دادهام
104
00:03:25,519 –> 00:03:27,040
و ما یک شروع سریع داریم که میتوانیم آن را
105
00:03:27,040 –> 00:03:28,879
دنبال
106
00:03:28,879 –> 00:03:31,040
کنیم تا شروع سریع داشته باشیم و
107
00:03:31,040 –> 00:03:32,319
داستانهای برتر
108
00:03:32,319 –> 00:03:34,959
بر اساس موضوع و جستجوی پرس و جو داریم، بنابراین
109
00:03:34,959 –> 00:03:36,000
من میخواهم چه کار کنم آیا من فقط می خواهم
110
00:03:36,000 –> 00:03:37,760
کاری را که انجام دادم تکرار کنم،
111
00:03:37,760 –> 00:03:40,480
بنابراین شروع سریع را کپی می کنیم
112
00:03:40,480 –> 00:03:42,159
و به کد خود باز می گردیم
113
00:03:42,159 –> 00:03:45,040
و آن را در آنجا می چسبانیم و ما فقط می
114
00:03:45,040 –> 00:03:47,360
خواهیم اسناد واقعی را به عقب واقعی
115
00:03:47,360 –> 00:03:49,440
بخریم، یک جستجوی پرس و جو بخریم، بنابراین ما” دوباره میگوییم
116
00:03:49,440 –> 00:03:51,680
جستجو برابر است با
117
00:03:51,680 –> 00:03:54,159
جستجوی نقطهای gm و سپس عبارت خود را در آنجا تایپ کنید
118
00:03:54,159 –> 00:03:54,799
119
00:03:54,799 –> 00:03:57,680
و ما نمیتوانیم بیش از یک محدودیت زمانی این کار را انجام دهیم، بنابراین
120
00:03:57,680 –> 00:03:59,040
من میخواهم آن را برای یک دقیقه نادیده بگیرم
121
00:03:59,040 –> 00:04:00,640
و فقط ببینم چند نتیجه دریافت
122
00:04:00,640 –> 00:04:01,439
123
00:04:01,439 –> 00:04:04,239
میکنیم تا بتوانیم میخواهیم بگوییم جستجوی ما
124
00:04:04,239 –> 00:04:05,680
قفل شده است، این همان کاری است که ما
125
00:04:05,680 –> 00:04:08,319
انجام دادیم و سپس ببینیم
126
00:04:08,319 –> 00:04:09,680
وقتی جستجو را چاپ میکنیم چه اتفاقی میافتد
127
00:04:09,680 –> 00:04:12,480
حالا
128
00:04:13,120 –> 00:04:15,439
خوب کار می کند، ما داده های زیادی دریافت کردیم
129
00:04:15,439 –> 00:04:17,600
130
00:04:17,600 –> 00:04:20,320
وای خیلی زیاد، خیلی زیاد، و من حدس می زنم که
131
00:04:20,320 –> 00:04:20,959
132
00:04:20,959 –> 00:04:24,880
فقط با نگاه کردن به برخی از این موارد،
133
00:04:24,880 –> 00:04:28,960
ما اصلاً هدفمند جغرافیایی نیستیم
134
00:04:28,960 –> 00:04:32,400
واشینگتون پست بله، ما
135
00:04:32,400 –> 00:04:34,800
خوب پاسخ می دهیم خوب است، بیایید به پایین پیمایش کنیم
136
00:04:34,800 –> 00:04:36,000
، پس بیایید ببینیم
137
00:04:36,000 –> 00:04:39,040
در کجا هستیم، بیایید نگاهی
138
00:04:39,040 –> 00:04:42,160
به فرهنگ لغت بیندازیم تا بتوانیم
139
00:04:42,160 –> 00:04:45,199
کلیدهای نقطهای را انجام دهیم و ببینیم چه کلیدهایی
140
00:04:45,199 –> 00:04:46,960
141
00:04:46,960 –> 00:04:50,639
درست میشوند، بنابراین فید و مدخل دریافت کردیم،
142
00:04:50,639 –> 00:04:53,919
پس بیایید جستجو کنیم، بیایید
143
00:04:53,919 –> 00:04:56,960
فید انجام دهیم بنابراین من فقط به این بخش
144
00:04:56,960 –> 00:04:58,400
از فرهنگ
145
00:04:58,400 –> 00:05:01,680
لغت دسترسی دارم برچسب فید به کلید فید متأسفم
146
00:05:01,680 –> 00:05:03,600
خوب است، بنابراین این همان چیزی است که
147
00:05:03,600 –> 00:05:05,039
توضیح می دهد همه چیز
148
00:05:05,039 –> 00:05:08,639
کجاست، بنابراین بیایید ورودی ها را انجام دهیم
149
00:05:08,639 –> 00:05:12,400
و این باید بقیه داده ها باشد
150
00:05:13,039 –> 00:05:16,479
بله، آیا ما یک عنوان برخی از
151
00:05:16,479 –> 00:05:18,800
توضیحات در اینجا
152
00:05:18,800 –> 00:05:22,960
من مطمئن هستم که انجام می دهیم پس بیایید چاپ
153
00:05:22,960 –> 00:05:26,160
کنیم اوه بیایید دوباره یک حلقه کامل برای
154
00:05:26,160 –> 00:05:30,880
مورد در ورودی های جستجو انجام
155
00:05:30,880 –> 00:05:34,160
دهیم مورد چاپ را انجام دهیم.
156
00:05:34,160 –> 00:05:36,240
157
00:05:36,240 –> 00:05:38,800
158
00:05:38,800 –> 00:05:41,919
بیایید ببین