در این مطلب، ویدئو آموزش برنامه نویسی پایتون – 35 – فرکانس شمار ورد (1/3) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,060 –> 00:00:03,270
چک من چک من یک دو خیلی خوب بچه ها
2
00:00:03,270 –> 00:00:05,279
در این ویدئو کاری که من می خواهم انجام دهم این است که
3
00:00:05,279 –> 00:00:06,750
می خواهم به شما بچه ها نشان دهم که چگونه یک کلمه شمار
4
00:00:06,750 –> 00:00:09,150
بسازید و این اساساً چه
5
00:00:09,150 –> 00:00:11,670
کاری انجام می دهد این است که از طریق یک صفحه وب مرور می شود
6
00:00:11,670 –> 00:00:13,559
و شما می توانید در واقع از آن استفاده کنید، حتی
7
00:00:13,559 –> 00:00:16,079
اگر یک فایل متنی مانند فایل متنی دارید یا من هیچ سندی را نمی
8
00:00:16,079 –> 00:00:18,270
دانم، اما من فقط به
9
00:00:18,270 –> 00:00:19,680
شما دوستان نشان می دهم که چگونه یک صفحه وب را خزیدن
10
00:00:19,680 –> 00:00:23,609
کنید و همه کلمات را در آنجا پیدا کنید و کاری که
11
00:00:23,609 –> 00:00:24,779
قرار است انجام دهد این است که کار می کند. برای نشان دادن
12
00:00:24,779 –> 00:00:26,970
تعداد دفعات استفاده از هر کلمه در
13
00:00:26,970 –> 00:00:30,060
حال حاضر، موتورهای جستجو در واقع این کار را زیاد انجام می دهند،
14
00:00:30,060 –> 00:00:32,850
شاید شما یک شبکه تبلیغاتی
15
00:00:32,850 –> 00:00:34,410
دارید که در حال ساختن آن هستید و می خواهید
16
00:00:34,410 –> 00:00:36,750
تبلیغات مرتبط با
17
00:00:36,750 –> 00:00:39,809
محتوا را در صفحات وب نمایش دهید، بنابراین نه تنها آیا
18
00:00:39,809 –> 00:00:41,520
این واقعا جالب است اما
19
00:00:41,520 –> 00:00:44,969
در بسیاری از موقعیت ها نیز مفید است، بنابراین کاری که
20
00:00:44,969 –> 00:00:46,289
ما می خواهیم انجام دهیم این است که
21
00:00:46,289 –> 00:00:49,980
درخواست ها را وارد می کنیم و البته
22
00:00:49,980 –> 00:00:52,980
برای زمانی که به URL متصل می شویم و
23
00:00:52,980 –> 00:00:54,750
تقریباً از آن اطلاعات دریافت می کنیم به این نیاز داریم. برای
24
00:00:54,750 –> 00:00:56,370
دانلود اطلاعات از یک صفحه وب،
25
00:00:56,370 –> 00:00:58,320
آن اطلاعات را درخواست می کنیم
26
00:00:58,320 –> 00:01:01,020
نه تنها دستوری که میدانید باید
27
00:01:01,020 –> 00:01:05,188
در مورد آن خوب باشد، بلکه کاری بعدی که
28
00:01:05,188 –> 00:01:07,110
میخواهیم انجام دهیم این است که Beautiful Soup وارد کنیم،
29
00:01:07,110 –> 00:01:09,360
به یاد داشته باشید که هر زمان که میخواهید بتراشید یا
30
00:01:09,360 –> 00:01:12,000
بخشهایی از صفحه وب را انتخاب کنید
31
00:01:12,000 –> 00:01:13,530
و من به شما بچهها نشان خواهم داد که چه چیزی من
32
00:01:13,530 –> 00:01:16,470
دقیقاً در اینجا در مورد آن صحبت می کنم، بنابراین دلیل
33
00:01:16,470 –> 00:01:18,600
اینکه ما نمی خواهیم
34
00:01:18,600 –> 00:01:20,820
تک تک کلمات این صفحه وب را بخزیم این است که
35
00:01:20,820 –> 00:01:23,549
برخی از کلمات مانند پسند کردن نظرات
36
00:01:23,549 –> 00:01:26,490
دوست داشتن نظرات همیشه ظاهر می
37
00:01:26,490 –> 00:01:28,229
شوند اما واقعاً مرتبط نیستند. این
38
00:01:28,229 –> 00:01:30,329
صفحه وب تنها کلمات مرتبطی که
39
00:01:30,329 –> 00:01:32,939
من به دنبال آن هستم تقریباً همین
40
00:01:32,939 –> 00:01:34,890
پیوندها در اینجا هستند، بنابراین ما می توانیم همه کلماتی را نادیده بگیریم
41
00:01:34,890 –> 00:01:38,070
، مانند پست شده در سپتامبر، همه
42
00:01:38,070 –> 00:01:39,540
مزخرفاتی که به آن نیاز نداریم و سوپ های زیبا
43
00:01:39,540 –> 00:01:41,820
به ما اجازه می دهند این کار را انجام دهیم و
44
00:01:41,820 –> 00:01:45,240
آخرین چیزی که به آن نیاز داریم اپراتور import است
45
00:01:45,240 –> 00:01:48,869
و آن بازویی است که هر زمان که
46
00:01:48,869 –> 00:01:50,189
تعداد کلمات نهایی را انجام میدهیم، یک
47
00:01:50,189 –> 00:01:53,210
دیکشنری خواهیم داشت، کلماتی
48
00:01:53,210 –> 00:01:57,060
مانند وضعیت برنامهنویس را نمیدانم و
49
00:01:57,060 –> 00:01:59,040
آنها کلیدها و کلیدها هستند.
50
00:01:59,040 –> 00:02:01,140
ارزش ها چند برابر
51
00:02:01,140 –> 00:02:02,729
می شوند اتفاق افتاده است، بنابراین
52
00:02:02,729 –> 00:02:06,659
میخواهیم چیزی شبیه برنامهنویسی بازویی را 18
53
00:02:06,659 –> 00:02:09,598
بار در دو برابر بگوییم،
54
00:02:09,598 –> 00:02:12,750
بنابراین حالا بیایید جلو برویم و شروع کنیم،
55
00:02:12,750 –> 00:02:13,860
بنابراین اولین کاری که باید انجام دهیم
56
00:02:13,860 –> 00:02:16,380
این است که یک تابع بسازیم و من این را تجزیه میکنم.
57
00:02:16,380 –> 00:02:17,490
58
00:02:17,490 –> 00:02:20,070
به سه تابع برنامهریزی کنید، اولین
59
00:02:20,070 –> 00:02:23,670
تابع فقط فهرستی از هر
60
00:02:23,670 –> 00:02:25,770
کلمه در اینجا ایجاد میکند، بنابراین این همان کاری است که من
61
00:02:25,770 –> 00:02:27,180
انجام میدهم و
62
00:02:27,180 –> 00:02:28,910
وقتی به آنها رسیدیم سایر توابع را برای شما توضیح خواهم داد،
63
00:02:28,910 –> 00:02:35,370
اما اوه من اوه من گذاشتم. در PI، اما از آنجایی که
64
00:02:35,370 –> 00:02:37,920
این نقطه شروع ماست، کاری که من
65
00:02:37,920 –> 00:02:39,959
میخواهم انجام دهم این است که فقط نام آن را شروع
66
00:02:39,959 –> 00:02:43,200
کنم و آن را در یک URL ارسال کنید، بنابراین واقعاً
67
00:02:43,200 –> 00:02:44,040
چه کاری میتوانم انجام
68
00:02:44,040 –> 00:02:46,200
دهم، بعداً با آن تماس خواهم گرفت و
69
00:02:46,200 –> 00:02:49,680
نمیخواهم واقعاً نگران آن باشم. همه چیز درست است،
70
00:02:49,680 –> 00:02:51,810
بنابراین اولین کاری که باید انجام دهیم این است که
71
00:02:51,810 –> 00:02:54,660
باید یک لیست خالی به عنوان لیست کلمات ایجاد کنیم
72
00:02:54,660 –> 00:02:57,690
و سپس آن را برابر با
73
00:02:57,690 –> 00:02:59,550
لیست خالی قرار دهیم و در نهایت کاری که می
74
00:02:59,550 –> 00:03:03,360
خواهیم انجام دهیم این است که همه کد منبع
75
00:03:03,360 –> 00:03:06,000
را از آن دریافت کنیم. وب سایت و انتخاب
76
00:03:06,000 –> 00:03:07,830
کلمه به کلمه و انداختن آن در آن
77
00:03:07,830 –> 00:03:10,560
لی بنابراین برای اتصال به صفحه وب
78
00:03:10,560 –> 00:03:16,320
البته درخواست ها دریافت و دریافت تقریباً
79
00:03:16,320 –> 00:03:18,750
به این معنی است که چه چیزی می خواهید
80
00:03:18,750 –> 00:03:21,420
اطلاعاتی را از هر URL که ارسال می کنیم به خوبی دریافت کنید
81
00:03:21,420 –> 00:03:23,070
که در اصل
82
00:03:23,070 –> 00:03:27,299
این URL است و دوباره همانطور که گفتم
83
00:03:27,299 –> 00:03:29,489
تقریباً می توانید انجام دهید این برای هر صفحه وب است، اما
84
00:03:29,489 –> 00:03:30,690
من نمیخواهم به
85
00:03:30,690 –> 00:03:32,489
Craigslist یا چیز دیگری بروم، یا
86
00:03:32,489 –> 00:03:34,380
میخواهم کیف ایمیل باکی را دریافت کنم، شما
87
00:03:34,380 –> 00:03:36,750
نمیتوانید این کار را در صفحه وب ما انجام دهید و سپس
88
00:03:36,750 –> 00:03:38,250
شکایت میکنم. من، پس من فعلاً این کار را
89
00:03:38,250 –> 00:03:40,830
برای خودم انجام می دهم، اگر بچه ها می خواهید
90
00:03:40,830 –> 00:03:42,690
صفحه وب من را بخزید، خوب است، من به شما
91
00:03:42,690 –> 00:03:44,970
اجازه می دهم فقط از سوء استفاده یا
92
00:03:44,970 –> 00:03:47,519
هر چیز دیگری خوشتان نیاید، بنابراین کاری که قرار
93
00:03:47,519 –> 00:03:49,620
است انجام دهد این است که به آن
94
00:03:49,620 –> 00:03:53,310
URL یا آن صفحه وب متصل شوید و این بدان معناست که
95
00:03:53,310 –> 00:03:55,200
تقریباً فقط از آن به عنوان متن ساده استفاده کنید
96
00:03:55,200 –> 00:03:57,959
، دوست ندارم، آن را به عنوان هر
97
00:03:57,959 –> 00:04:00,540
داده باینری رمزگذاری شده عجیب و غریب یا هر چیزی شبیه به
98
00:04:00,540 –> 00:04:04,380
آن می کشم، بنابراین اکنون که تقریباً همه
99
00:04:04,380 –> 00:04:07,709
کد منبع را داریم صفحه وب چیزی که
100
00:04:07,709 –> 00:04:11,160
ما به آن نگاه می کنیم تقریباً
101
00:04:11,160 –> 00:04:13,920
همه چیز مزخرف است، البته هر زمان که
102
00:04:13,920 –> 00:04:15,890
از beaut استفاده می کنیم ifulsoup
103
00:04:15,890 –> 00:04:19,108
ما باید آن را به یک شی سوپ تبدیل کنیم،
104
00:04:19,108 –> 00:04:21,620
بنابراین کد منبعی را که به تازگی
105
00:04:21,620 –> 00:04:25,380
برداشتهاید و در اینجا پرتاب کنید، بگیرید و اکنون
106
00:04:25,380 –> 00:04:26,510
107
00:04:26,510 –> 00:04:28,530
شیء سوپ شما چیزی است که
108
00:04:28,530 –> 00:04:30,930
در واقع میتوانید با آن کار کنید، بنابراین کاری که من میخواهم انجام دهم این
109
00:04:30,930 –> 00:04:34,950
است که میخواهم این کار را انجام دهم و بیا
110
00:04:34,950 –> 00:04:37,860
capslock پس در حال حاضر ما به
111
00:04:37,860 –> 00:04:39,810
این همه مزخرف نگاه می کنیم و البته نمی
112
00:04:39,810 –> 00:04:41,250
خواهیم فقط همه اینها را بخزیم
113
00:04:41,250 –> 00:04:43,110
وگرنه قرار است کلمات کلیدی عجیب و غریبی مانند
114
00:04:43,110 –> 00:04:47,760
کلاس div دریافت کنیم، می دانید IMG ما به آن اهمیتی
115
00:04:47,760 –> 00:04:50,040
نمی دهیم چیزی که ما به آن اهمیت می دهیم
116
00:04:50,040 –> 00:04:54,720
فقط متن و این پیوندها در اینجاست، بنابراین
117
00:04:54,720 –> 00:04:58,140
بیایید ادامه دهیم و این را بررسی کنیم و ببینیم
118
00:04:58,140 –> 00:05:00,090
چه ویژگی منحصر به فرد این پیوندها است
119
00:05:00,090 –> 00:05:03,300