در این مطلب، ویدئو چگونه به راحتی!! تصاویر مشابه را در پایتون با استفاده از یادگیری ماشین با جستجوی تصویر عمیق پیدا کنید با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:11:09
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:01,430 –> 00:00:04,509
[Music]
2
00:00:11,519 –> 00:00:13,440
سلام و به این ویدیو در این ویدیو خوش آمدید،
3
00:00:13,440 –> 00:00:14,880
من قصد دارم نحوه
4
00:00:14,880 –> 00:00:16,960
استفاده از یک تصویر را برای جستجو در یک
5
00:00:16,960 –> 00:00:19,600
فهرست برای یافتن تصاویر مشابه پوشش دهم و
6
00:00:19,600 –> 00:00:21,359
ما این کار را در پایتون
7
00:00:21,359 –> 00:00:24,320
با استفاده از کتابخانه ای به نام deep انجام خواهیم داد. جستجوی تصویر
8
00:00:24,320 –> 00:00:26,160
چیزی که این کتابخانه را بهویژه
9
00:00:26,160 –> 00:00:27,920
عالی میکند این واقعیت است که ما میتوانیم
10
00:00:27,920 –> 00:00:30,320
این کار بسیار دشوار را انجام دهیم و تنها حدود
11
00:00:30,320 –> 00:00:33,040
پنج خط کد پایتون را انجام دهیم، بنابراین اگر
12
00:00:33,040 –> 00:00:34,559
میخواهید یاد بگیرید که چگونه از یک تصویر برای جستجو
13
00:00:34,559 –> 00:00:36,880
در فهرست یا فهرستهای
14
00:00:36,880 –> 00:00:39,120
تصاویر مشابه استفاده کنید.
15
00:00:39,120 –> 00:00:40,559
این ویدیو برای شماست،
16
00:00:40,559 –> 00:00:42,879
چیزی که جستجوی تصویر عمیق را عالی می کند
17
00:00:42,879 –> 00:00:44,640
این واقعیت است که دو کتابخانه دیگر را
18
00:00:44,640 –> 00:00:46,559
برای شما پیچیده می کند، اولین آن
19
00:00:46,559 –> 00:00:48,399
tensorflow است که یک چارچوب یادگیری عمیق
20
00:00:48,399 –> 00:00:50,559
در پایتون است که
21
00:00:50,559 –> 00:00:51,680
22
00:00:51,680 –> 00:00:52,879
یکی از مواردی که از گوگل به ما می رسد. با کتابخانه tensorflow این کار را انجام می دهد این
23
00:00:52,879 –> 00:00:54,960
است که یک
24
00:00:54,960 –> 00:00:57,760
معماری شبکه عصبی به نام vgg16
25
00:00:57,760 –> 00:00:59,840
را بارگذاری می کند و وزن های از پیش آموزش داده شده برای
26
00:00:59,840 –> 00:01:02,320
آن معماری را از imagenet بارگیری می کند، مرحله بعدی
27
00:01:02,320 –> 00:01:04,400
این فرآیند پس از بارگیری مدل با
28
00:01:04,400 –> 00:01:06,000
Wi وزن از پیش آموزش داده شده و
29
00:01:06,000 –> 00:01:08,400
جستجوی تصویر عمیق این است که هر تصویر
30
00:01:08,400 –> 00:01:11,040
در دایرکتوری یا دایرکتوری ها به
31
00:01:11,040 –> 00:01:13,439
این مدل وارد می شود، کاری که این مدل برای ما انجام
32
00:01:13,439 –> 00:01:16,080
می دهد این است که تمام تصاویر ما را بردار
33
00:01:16,080 –> 00:01:17,600
می کند به عبارت دیگر آنها را به داده های عددی خام تبدیل می کند.
34
00:01:17,600 –> 00:01:19,920
35
00:01:19,920 –> 00:01:20,960
36
00:01:20,960 –> 00:01:22,799
سپس آنچه در جستجوی تصویر عمیق اتفاق میافتد
37
00:01:22,799 –> 00:01:24,880
این است که آن بردارها به
38
00:01:24,880 –> 00:01:27,600
کتابخانه دیگری به نام annoy annoy
39
00:01:27,600 –> 00:01:29,840
از spotify به ما منتقل میشوند و
40
00:01:29,840 –> 00:01:31,680
در خوشهبندی یا یافتن
41
00:01:31,680 –> 00:01:33,040
الگوها در
42
00:01:33,040 –> 00:01:35,520
بخشهای مختلف داده در مورد
43
00:01:35,520 –> 00:01:37,200
ما که با عددی کار میکنیم بسیار کارآمد است. دادههایی
44
00:01:37,200 –> 00:01:38,880
که تصاویر را نشان
45
00:01:38,880 –> 00:01:40,479
میدهند، الگوریتم مزاحم
46
00:01:40,479 –> 00:01:42,640
سپس در تمام تصاویر شما میرود و
47
00:01:42,640 –> 00:01:44,799
الگوها را پیدا میکند و آن الگوها
48
00:01:44,799 –> 00:01:47,280
نشاندهنده شباهت کاری است که جستجوی تصویر عمیق
49
00:01:47,280 –> 00:01:48,960
انجام میدهد، بنابراین دو
50
00:01:48,960 –> 00:01:50,960
کتابخانه بسیار قدرتمند آنها
51
00:01:50,960 –> 00:01:52,560
را برای شما گرد هم میآورد و به شما اجازه میدهد تا
52
00:01:52,560 –> 00:01:54,960
این کارهای بسیار پیچیده را انجام دهید. فقط حدود
53
00:01:54,960 –> 00:01:57,200
پنج خط کد پایتون، بنابراین
54
00:01:57,200 –> 00:01:58,960
اگر به نحوه کار کردن این برنامه علاقه مند هستید، اجازه دهید
55
00:01:58,960 –> 00:02:00,799
به آزمایشگاه مشتری برویم و نگاهی به آن بیندازیم.
56
00:02:00,799 –> 00:02:02,799
در عمل
57
00:02:02,799 –> 00:02:04,399
اگر پایتون را روی
58
00:02:04,399 –> 00:02:06,479
سیستم خود نصب کرده اید، تنها کاری که باید انجام دهید این است که
59
00:02:06,479 –> 00:02:08,720
جستجوی تصویر عمیق را با
60
00:02:08,720 –> 00:02:12,000
پیپ اجرا کنید، من
61
00:02:12,000 –> 00:02:13,920
فکر نمی کنم پیپ به حروف بزرگ و کوچک حساس است،
62
00:02:13,920 –> 00:02:15,360
ممکن است اشتباه کرده باشم، اما مطمئن شوید که شما
63
00:02:15,360 –> 00:02:18,640
64
00:02:18,640 –> 00:02:20,239
65
00:02:20,239 –> 00:02:22,239
اگر از لینوکس یا مک استفاده میکنید، میتوانید از d capital i و capital s استفاده کنید، اگر جستجوی دبیان را نصب کردید، میتوانید از آن استفاده
66
00:02:22,239 –> 00:02:24,080
67
00:02:24,080 –> 00:02:26,319
کنید، نصب این کتابخانه بر روی
68
00:02:26,319 –> 00:02:28,800
سیستم شما بسیار سادهتر خواهد بود. با استفاده از رایانه شخصی،
69
00:02:28,800 –> 00:02:30,640
70
00:02:30,640 –> 00:02:32,080
در اینجا با این خطا مواجه خواهید شد، این نشان می دهد که
71
00:02:32,080 –> 00:02:35,360
microsoft visual c plus
72
00:02:35,360 –> 00:02:37,920
14.0 برای نصب microsoft visual c
73
00:02:37,920 –> 00:02:40,160
plus plus
74
00:02:40,160 –> 00:02:42,959
لازم است، اگر پیدا کردید مراحل این پست سرریز پشته را برای شما دنبال خواهید کرد.
75
00:02:42,959 –> 00:02:44,959
این پست کمی گیج کننده است، فقط
76
00:02:44,959 –> 00:02:47,200
به این پاسخ که
77
00:02:47,200 –> 00:02:50,480
65 رای موافق دارد، اینجا نگاه کنید و متوجه خواهید شد که اگر
78
00:02:50,480 –> 00:02:52,800
79
00:02:52,800 –> 00:02:54,160
می خواهید این مراحل
80
00:02:54,160 –> 00:02:56,080
کمی ساده تر تجزیه و تحلیل شوند، می توانید به راحتی آن را دنبال کنید تا
81
00:02:56,080 –> 00:02:59,840
کتاب درسی من را در cltk بررسی کنید. pythonhumanities.com
82
00:02:59,840 –> 00:03:01,599
an به قسمت نصب یا
83
00:03:01,599 –> 00:03:03,360
فصل 1 آن کتاب درسی بروید و متوجه خواهید شد
84
00:03:03,360 –> 00:03:05,360
که چگونه آن را روی سیستم خود
85
00:03:05,360 –> 00:03:07,519
با ویندوز
86
00:03:07,519 –> 00:03:08,720
نصب کنید، پس از اینکه همه چیز را
87
00:03:08,720 –> 00:03:10,879
به درستی نصب کردید، می توانید از
88
00:03:10,879 –> 00:03:13,280
کتابخانه جستجوی تصویر
89
00:03:13,280 –> 00:03:16,000
عمیق استفاده کنید. برای اینکه ببینم
90
00:03:16,000 –> 00:03:18,640
کل این فرآیند اکنون چگونه کار میکند،
91
00:03:18,640 –> 00:03:20,159
میخواهم یک لحظه وقت بگذارم و
92
00:03:20,159 –> 00:03:21,920
این دایرکتوری را که دوباره
93
00:03:21,920 –> 00:03:24,400
در github در دسترس خواهد بود،
94
00:03:24,400 –> 00:03:26,799
اولین چیزی که میخواهیم به آن نگاه کنیم این است که
95
00:03:26,799 –> 00:03:28,879
دادهها مجموعهای از تصاویر هستند. اکنون اینها
96
00:03:28,879 –> 00:03:30,400
تصاویر دنیای واقعی هستند که در
97
00:03:30,400 –> 00:03:31,920
مالکیت عمومی قرار دارند و در وب سایت موزه
98
00:03:31,920 –> 00:03:33,200
یادبود هولوکاست ایالات متحده قرار دارند
99
00:03:33,200 –> 00:03:35,440
، می توانید به آنجا
100
00:03:35,440 –> 00:03:36,959
بروید و در واقع همه آنها را
101
00:03:36,959 –> 00:03:38,640
که من چند مورد را انتخاب کرده ام پیدا کنید، زیرا
102
00:03:38,640 –> 00:03:41,040
اینها یک مشکل دنیای واقعی را نشان می دهد. بسیاری از
103
00:03:41,040 –> 00:03:42,879
این تصاویر به این شکل به نظر می رسند،
104
00:03:42,879 –> 00:03:44,959
بخشی از یک دفترچه خاطرات هستند، برخی از این تصاویر،
105
00:03:44,959 –> 00:03:47,040
با این حال، اگر به داده ها برگردیم و
106
00:03:47,040 –> 00:03:49,760
به تصویر 51 برویم، در اینجا حاوی
107
00:03:49,760 –> 00:03:52,000
عکس هایی خواهیم بود، فرض کنیم که
108
00:03:52,000 –> 00:03:54,080
همه این فهرست را داریم. این صفحات مجلات مختلف هستند
109
00:03:54,080 –> 00:03:56,239
و ما می خواهیم
110
00:03:56,239 –> 00:03:58,640
تصاویر آن صفحات مجله را
111
00:03:58,640 –> 00:04:00,720
که حاوی عکس هستند در داخل آنها پیدا کنیم، روشی
112
00:04:00,720 –> 00:04:02,239
که شما باید این کار را به روش آنالوگ
113
00:04:02,239 –> 00:04:03,760
انجام دهید، به نوعی مطالعه کل
114
00:04:03,760 –> 00:04:05,519
دایرکتوری است، اما ما مجبور نیستیم این کار را انجام دهیم.
115
00:04:05,519 –> 00:04:07,920
ما میتوانیم هر کاری را در پایتون با جستجوی تصویر عمیق انجام دهیم،
116
00:04:07,920 –> 00:04:09,680
117
00:04:09,680 –> 00:04:10,720
بنابراین اولین کاری که
118
00:04:10,720 –> 00:04:12,560
برای حل این مشکل انجام میدهیم این است که
119
00:04:12,560 –> 00:04:14,480
باید آن را وارد کنیم، بنابراین آنچه باید
120
00:04:14,480 –> 00:04:16,238
انجام دهیم این است که باید از
121
00:04:16,238 –> 00:04:18,320
تصویر عمیق بگوییم
122
00:04:18,320 –> 00:04:19,759
جستجو برای درست نگه داشتن حروف بزرگ شما
123
00:04:19,759 –> 00:04:21,600
در اینجا مهم است، وارد کنید و ما
124
00:04:21,600 –> 00:04:25,120
کلاس شاخص، کلاس داده بارگذاری و
125
00:04:25,120 –> 00:04:28,160
کلاس تصویر جستجو را دوباره وارد می کنیم، مطمئن شوید
126
00:04:28,160 –> 00:04:30,560
که حروف بزرگ شما در اینجا روی
127
00:04:30,560 –> 00:04:32,880
نقطه سرمایه i برای شاخص l و d و
128
00:04:32,880 –> 00:04:36,000
بارگذاری داده ها و s است. و من و تصویر را به
129
00:04:36,000 –> 00:04:37,600
محض اجرای شما جستجو می کنم که ممکن است
130
00:04:37,600 –> 00:04:39,680
چند دقیقه طول بکشد تا این همه بارگذاری شود، اوه
131
00:04:39,680 –> 00:04:40,720
شما می توانید در واقع
132
00:04:40,720 –> 00:04:42,560
133
00:04:42,560 –> 00:04:44,560
اکنون با کتابخانه جستجوی تصویر عمیق شروع به کار کنید برای این نمایش
134
00:04:44,560 –> 00:04:46,720
من همه کارها را روی cpu انجام می دهم. همانطور که من همیشه
135
00:04:46,720 –> 00:04:48,479
انجام می دهم متوجه خواهید شد که
136
00:04:48,479 –> 00:04:51,120
زمان اجرا من به نوعی کوتاه است و دلیل
137
00:04:51,120 –> 00:04:52,720
این امر این است که من
138
00:04:52,720 –> 00:04:55,600
فقط با مجموعه بسیار کوچکی از داده ها کار می کنم، در مجموع 66 تصویر،
139
00:04:55,600 –> 00:04:57,040
140
00:04:57,040 –> 00:04:59,120
بیایید به جلو برویم و آن تصاویر را بگیریم،
141
00:04:59,120 –> 00:05:01,919
بنابراین مستندات و مخزن
142
00:05:01,919 –> 00:05:03,919
من می خواهم بگویم لیست زیر خط تصویر
143
00:05:03,919 –> 00:05:06,240
و این برابر با بارگذاری
144
00:05:06,240 –> 00:05:09,039
سرمایه داده l سرمایه d خواهد بود و این
145
00:05:09,039 –> 00:05:10,240
کلاس واقعاً چند
146
00:05:10,240 –> 00:05:11,840
آرگومان مختلف را می گیرد اولین چیزی که
147
00:05:11,840 –> 00:05:13,199
باید بگوییم
148
00:05:13,199 –> 00:05:14,720
از
149
00:05:14,720 –> 00:05:15,759
پوشه است
150
00:05:15,759 –> 00:05:18,320
و سپس باید گرفتن در برخی از داده ها
151
00:05:18,320 –> 00:05:20,000
این به یک آرگومان نیاز دارد،
152
00:05:20,000 –> 00:05:22,800
لیستی خواهد بود که این لیست
153
00:05:22,800 –> 00:05:25,919
باید جایی باشد که داده های شما واقعاً در مورد من قرار می گیرد، در
154
00:05:25,919 –> 00:05:27,680
مورد من همه چیز
155
00:05:27,680 –> 00:05:29,840
در یک فهرست
156
00:05:29,840 –> 00:05:31,280
قرار دارد.
157
00:05:31,280 –> 00:05:33,039
در صورتی که تصاویر ما در
158
00:05:33,039 –> 00:05:35,199
حدود 10 یا 20 دایرکتوری هستند، اگر
159
00:05:35,199 –> 00:05:36,960
لازم باشد آنها را از جاهای دیگر
160
00:05:36,960 –> 00:05:38,720
برداریم، پس وقتی آن را بارگذاری ک