در این مطلب، ویدئو Duduplication فازی با پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:08:22
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,439 –> 00:00:03,510
سلام، امروز
2
00:00:03,510 –> 00:00:06,120
یک مجموعه داده کثیف را با استفاده از
3
00:00:06,120 –> 00:00:09,210
یادگیری ماشین
4
00:00:09,210 –> 00:00:10,590
5
00:00:10,590 –> 00:00:14,099
6
00:00:14,099 –> 00:00:22,740
انجام می دهیم.
7
00:00:22,740 –> 00:00:29,340
نصب خوب با لینوکس Mac OS X OS X
8
00:00:29,340 –> 00:00:31,560
من آن را در اینجا در
9
00:00:31,560 –> 00:00:33,690
زیرسیستم ویندوز برای لینوکس اجرا کردم، اگر میخواهید این کار را روی ساده وانیلی انجام دهید، پیوندی درباره
10
00:00:33,690 –> 00:00:35,280
نحوه راهاندازی زیرسیستم ویندوز برای
11
00:00:35,280 –> 00:00:38,010
لینوکس در توضیحات میگذارم.
12
00:00:38,010 –> 00:00:40,079
ویندوز من
13
00:00:40,079 –> 00:00:42,510
فکر می کنم باید Microsoft
14
00:00:42,510 –> 00:00:47,450
build tools 2015 را نصب کنید تا بتوانید
15
00:00:47,450 –> 00:00:51,210
نسخه مناسب C++ را دریافت کنید زیرا من
16
00:00:51,210 –> 00:00:55,590
برای این کار به C++ در پس زمینه نیاز دارم، بنابراین اگر
17
00:00:55,590 –> 00:00:57,469
شما یک زیرسیستم oo sex یا لینوکس یا ویندوز
18
00:00:57,469 –> 00:00:59,940
برای لینوکس هستید، اوه برنده خواهید شد.
19
00:00:59,940 –> 00:01:01,020
حتی مجبور نیستید با آن مقابله کنید،
20
00:01:01,020 –> 00:01:05,159
بنابراین اکنون که نصب شد، ما
21
00:01:05,159 –> 00:01:10,860
وارد ایمپورت میکنیم و به عنوان PD و
22
00:01:10,860 –> 00:01:15,810
وارد میکنیم و همانطور که تاکید شد
23
00:01:15,810 –> 00:01:20,549
کتابخانهای را که تازه نصب کردهایم استنباط میکنیم و سپس
24
00:01:20,549 –> 00:01:24,000
میتوانیم نگاهی بیندازیم. در مجموعه داده های ما
25
00:01:24,000 –> 00:01:28,439
این را از وب سایت کاخ سفید دریافت کردم
26
00:01:28,439 –> 00:01:30,450
لینکی را در توضیحات قرار دهید تا
27
00:01:30,450 –> 00:01:32,400
بتوانید دنبال کنید اینها
28
00:01:32,400 –> 00:01:34,079
فقط اسامی بازدیدکنندگان افراد مختلفی هستند
29
00:01:34,079 –> 00:01:37,049
که در طول سال ها از کاخ سفید بازدید کرده اند
30
00:01:37,049 –> 00:01:41,400
، بنابراین ما قصد داریم
31
00:01:41,400 –> 00:01:43,530
به برخی از این اسامی نگاهی بیندازیم و وجود
32
00:01:43,530 –> 00:01:45,750
خواهد داشت. افرادی که چندین بار بازدید کرده اند
33
00:01:45,750 –> 00:01:47,369
و املای
34
00:01:47,369 –> 00:01:49,110
نام آنها همیشه یکسان
35
00:01:49,110 –> 00:01:51,240
نیست، بنابراین ما افرادی
36
00:01:51,240 –> 00:01:56,000
را که دوباره از کاخ سفید بازدید کرده اند را انتخاب می کنیم، بنابراین
37
00:01:56,000 –> 00:01:58,409
اولین کاری که می خواهیم انجام دهیم این است
38
00:01:58,409 –> 00:02:00,299
که چارچوب داده خود را وارد کنیم. ما این CSV کاخ سفید را داریم،
39
00:02:00,299 –> 00:02:04,079
بنابراین چارچوب دادهها بله
40
00:02:04,079 –> 00:02:09,288
برابر است با PD بخوانید CSV
41
00:02:09,288 –> 00:02:13,540
، زیر خط سفید تخممرغ
42
00:02:13,540 –> 00:02:18,260
درست میشود و سپس میتوانیم بگوییم که برابر است، اکنون فرآیند حذف
43
00:02:18,260 –> 00:02:19,610
دوگانه را شروع
44
00:02:19,610 –> 00:02:23,269
میکنیم و همانطور که شما انجام میدهید و سپس ما
45
00:02:23,269 –> 00:02:26,680
46
00:02:26,680 –> 00:02:31,129
اولین کاری که میخواهیم انجام دهیم، روش قاب داده YouTube را فراخوانی میکنیم این است که اولین
47
00:02:31,129 –> 00:02:33,230
آرگومان در اینجا چارچوب دادهای است که
48
00:02:33,230 –> 00:02:35,150
میخواهید انجام دهید، بنابراین ما فقط با DF میرویم
49
00:02:35,150 –> 00:02:38,000
و سپس میخواهید از لیستی از
50
00:02:38,000 –> 00:02:41,030
فیلدهای مختلف استفاده کنید. برای انجام
51
00:02:41,030 –> 00:02:43,549
بر اساس پس بیایید تاک و نگاهی
52
00:02:43,549 –> 00:02:46,160
به نام فیلدها بیایید فقط هر سه
53
00:02:46,160 –> 00:02:53,269
آنها را انجام دهیم تا ابتدا یک نام خانوادگی و نام متوسط به دست آورید، بنابر
54
00:02:53,269 –> 00:03:06,650
ین اجرا کنید که داده
55
00:03:06,650 –> 00:03:08,870
ا را وارد کند، یک ثانیه طول میکشد تا من
56
00:03:08,870 –> 00:03:12,970
لافاصله برگردم، ما برگشت
57
00:03:12,970 –> 00:03:15,560
م بنابراین بیایید این روز را برچسب گذاری
58
00:03:15,560 –> 00:03:20,329
کنیم که ما چند گزینه مختلف
59
00:03:20,329 –> 00:03:22,220
برای داده هایی داریم که در حال بررسی آنها هستیم، می توانید
60
00:03:22,220 –> 00:03:25,519
بگویید بله این همان شخص
61
00:03:25,519 –> 00:03:27,859
است نه این همان شخص نیست ما مطمئن نیستیم که آیا
62
00:03:27,859 –> 00:03:29,750
همان شخص است یا اگر کارتان تمام
63
00:03:29,750 –> 00:03:32,959
شده است، میتوانید تمام شده را تایپ کنید و سپس
64
00:03:32,959 –> 00:03:35,450
بیایید اینجا را ببینیم، بنابراین به
65
00:03:35,450 –> 00:03:38,060
اولین کسی که جیمز از تماسگیرنده جین کال جیمز خواسته است، نگاه کنیم
66
00:03:38,060 –> 00:03:40,160
که واضح است که همان
67
00:03:40,160 –> 00:03:43,370
شخص نیست، بنابراین ادامه دهید و سپس یک
68
00:03:43,370 –> 00:03:45,530
گزینه دیگر ظاهر میشود که قبلی است، بنابراین
69
00:03:45,530 –> 00:03:46,790
70
00:03:46,790 –> 00:03:48,590
اگر فکر میکنید
71
00:03:48,590 –> 00:03:52,069
اشتباه کردهاید، همیشه میتوانید به شخص قبلی برگردید، دوباره جیمز جیمز کلر را میبیند و خاکستر را میبیند،
72
00:03:52,069 –> 00:03:53,810
بنابراین میگویید نه این
73
00:03:53,810 –> 00:03:56,090
درست نیست که همان شخص نیست، و
74
00:03:56,090 –> 00:03:57,680
سپس فقط مرور میکنید و به تعدادی برچسب میزنید.
75
00:03:57,680 –> 00:04:01,849
از اینها، بنابراین شما می دانید که من
76
00:04:01,849 –> 00:04:04,569
در مورد آن مطم