در این مطلب، ویدئو طبقه بندی تصویر تنسورفلو | طبقه بندی تصویر خود را در تنسورفلو بسازید | ادورکا با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:34:31
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:14,309 –> 00:00:16,320
سلام به همه و به این جلسه جالب خوش آمدید
2
00:00:16,320 –> 00:00:18,510
3
00:00:18,510 –> 00:00:20,670
طبقه بندی تصویر جریان فشرده ما در حال حاضر یادگیری عمیق
4
00:00:20,670 –> 00:00:22,439
و جریان تانسور یکی از داغ ترین
5
00:00:22,439 –> 00:00:24,810
موضوعات این روزها است و به دلیل خوبی
6
00:00:24,810 –> 00:00:27,360
پیشرفت در این
7
00:00:27,360 –> 00:00:29,310
صنعت این امکان را برای ماشین ها و
8
00:00:29,310 –> 00:00:32,189
کامپیوترها فراهم کرده است که چنین ویژگی هایی را انجام دهند.
9
00:00:32,189 –> 00:00:34,380
اصلا توانایی انسان را ندارد
10
00:00:34,380 –> 00:00:36,960
و هوش مصنوعی قرار است تا
11
00:00:36,960 –> 00:00:40,860
سال 2020 2.3 میلیون شغل ایجاد کند و
12
00:00:40,860 –> 00:00:43,260
بسیاری از اینها با جریان تانسور امکان پذیر است،
13
00:00:43,260 –> 00:00:45,570
بنابراین بچه ها در این جلسه
14
00:00:45,570 –> 00:00:47,789
اول از همه در مورد جریان تانسور و حرکت به شما توضیح می دهم.
15
00:00:47,789 –> 00:00:49,739
به جلو ما برخی
16
00:00:49,739 –> 00:00:52,230
از کاربردهای جریان تانسور را خواهیم دید پس از
17
00:00:52,230 –> 00:00:53,850
آن به شما توضیح خواهم داد
18
00:00:53,850 –> 00:00:56,129
که تشخیص تصویر چیست و چگونه
19
00:00:56,129 –> 00:00:58,230
اجرا می شود و پس از
20
00:00:58,230 –> 00:00:59,839
آن بلافاصله به مورد استفاده ما برای
21
00:00:59,839 –> 00:01:03,179
طبقه بندی تصویر جریان تانسور می پردازم، بنابراین
22
00:01:03,179 –> 00:01:05,580
دقیقاً چیست؟ در حال حاضر تانسور
23
00:01:05,580 –> 00:01:07,830
flow چارچوب یادگیری ماشین منبع باز گوگل
24
00:01:07,830 –> 00:01:09,690
برای برنامه نویسی جریان داده
25
00:01:09,690 –> 00:01:12,210
در طیف وسیعی از وظایف است، اگر در
26
00:01:12,210 –> 00:01:14,729
مورد جریان داده صحبت کنیم. روگرام نویسی که شامل
27
00:01:14,729 –> 00:01:16,979
صنایع دستی است، بنابراین گره ها در
28
00:01:16,979 –> 00:01:18,960
نمودار عملیات ریاضی را نشان می دهند،
29
00:01:18,960 –> 00:01:20,969
در حالی که لبه های نمودار نشان دهنده
30
00:01:20,969 –> 00:01:23,189
آرایه های چند بعدی هستند که
31
00:01:23,189 –> 00:01:25,860
به عنوان تانسور نیز شناخته می شوند، بنابراین تانسورها چیزی
32
00:01:25,860 –> 00:01:28,219
نیستند جز آرایه های چند بعدی،
33
00:01:28,219 –> 00:01:30,509
توسعه ای برای جدول دو بعدی
34
00:01:30,509 –> 00:01:33,149
برای دادههایی با ابعاد بالاتر
35
00:01:33,149 –> 00:01:34,560
دارای ویژگیهای زیادی از تانسور هستند
36
00:01:34,560 –> 00:01:36,210
که آن را برای یادگیری عمیق مناسب میکند،
37
00:01:36,210 –> 00:01:38,789
زیرا میگوید کتابخانه منبع باز اصلی
38
00:01:38,789 –> 00:01:40,320
که به شما کمک میکند تا مدلهای یادگیری ماشینی را توسعه دهید و آموزش دهید،
39
00:01:40,320 –> 00:01:42,570
یکی از
40
00:01:42,570 –> 00:01:44,549
مزیتهای اصلی استفاده از جریان تانسور این است
41
00:01:44,549 –> 00:01:48,180
که باعث تخیل میشود. فرآیندها آسان تر است، به
42
00:01:48,180 –> 00:01:50,820
عنوان مثال اگر air BnB را به عنوان
43
00:01:50,820 –> 00:01:53,340
بازار آنلاین پیشرو جهانی در نظر بگیریم و
44
00:01:53,340 –> 00:01:54,539
بیمارستان یک شرکت خدماتی
45
00:01:54,539 –> 00:01:56,670
باشد، تجربه مهمان را با
46
00:01:56,670 –> 00:01:58,890
استفاده از جریان تانسور برای طبقه بندی تصاویر و
47
00:01:58,890 –> 00:02:01,560
تشخیص اشیاء در مقیاس بهبود می بخشد، بنابراین کاری که انجام می دهد این
48
00:02:01,560 –> 00:02:04,259
است که یک تصویر را به عنوان ورودی و به
49
00:02:04,259 –> 00:02:06,869
طور خودکار می گیرد. اکنون اگر در مورد صنعت بهداشت و درمان صحبت کنیم، آن را به عنوان اتاق خواب
50
00:02:06,869 –> 00:02:10,320
یا دستشویی یا سالن یا بالکن طبقه
51
00:02:10,320 –> 00:02:12,420
52
00:02:12,420 –> 00:02:14,520
بندی می کند. E Healthcare یک شبکه عصبی را
53
00:02:14,520 –> 00:02:17,120
با استفاده از جریان تانسور برای شناسایی
54
00:02:17,120 –> 00:02:20,880
آناتومیک خاص در طول آزمایشهای MRI مغز آموزش داد تا
55
00:02:20,880 –> 00:02:23,180
به بهبود سرعت و قابلیت اطمینان کمک کند
56
00:02:23,180 –> 00:02:25,920
نه تنها این جریان تانسور
57
00:02:25,920 –> 00:02:28,209
در صنعت برای بسیاری از موارد دیگر استفاده میشود،
58
00:02:28,209 –> 00:02:30,459
بلکه امروزه تمرکز ما بر طبقهبندی تصاویر است.
59
00:02:30,459 –> 00:02:32,620
که این سوال را ایجاد می کند
60
00:02:32,620 –> 00:02:34,530
که دقیقاً در طبقه بندی او چیست ،
61
00:02:34,530 –> 00:02:37,000
اکنون هدف از طبقه بندی یا طبقه بندی تصویر
62
00:02:37,000 –> 00:02:39,579
به طور کلی این است
63
00:02:39,579 –> 00:02:41,890
که تمام پیکسل های یک
64
00:02:41,890 –> 00:02:44,590
تصویر دیجیتال را به یک یا چند
65
00:02:44,590 –> 00:02:47,200
کلاس یا مضمون پوشش زمین طبقه بندی کند ، اساساً اکنون این
66
00:02:47,200 –> 00:02:49,120
داده های طبقه بندی ممکن است برای تولید
67
00:02:49,120 –> 00:02:51,939
موضوعی استفاده شود. نقشه های پوشش زمین موجود
68
00:02:51,939 –> 00:02:54,280
در یک تصویر و همچنین به
69
00:02:54,280 –> 00:02:56,859
وظیفه استخراج طبقات اطلاعاتی
70
00:02:56,859 –> 00:02:59,709
از یک تصویر شطرنجی چند باندی اشاره دارد، اکنون
71
00:02:59,709 –> 00:03:01,540
رستر حاصل از
72
00:03:01,540 –> 00:03:03,189
طبقه بندی تصویر می تواند برای ایجاد
73
00:03:03,189 –> 00:03:05,680
نقشه های موضوعی و بسته به
74
00:03:05,680 –> 00:03:07,599
تعامل بین تحلیلگر و
75
00:03:07,599 –> 00:03:09,879
رایانه استفاده شود. در طول طبقه بندی دو نوع طبقه بندی وجود دارد
76
00:03:09,879 –> 00:03:11,739
77
00:03:11,739 –> 00:03:13,450
که اساساً عبارتند از: نظارت و t او
78
00:03:13,450 –> 00:03:15,849
بدون نظارت، بنابراین اولین نمونه از
79
00:03:15,849 –> 00:03:17,290
کاری که میخواهیم انجام دهیم، آموزش یک
80
00:03:17,290 –> 00:03:20,230
مدل شبکه عصبی برای طبقهبندی
81
00:03:20,230 –> 00:03:23,260
تصاویر لباسهایی مانند کفشهای کتانی است و مطمئناً
82
00:03:23,260 –> 00:03:25,510
در اینجا من از Kiera استفاده میکنم که یک
83
00:03:25,510 –> 00:03:28,090
API سطح بالا برای ساخت و آموزش
84
00:03:28,090 –> 00:03:30,609
مدلهای بسیار کم است. برای
85
00:03:30,609 –> 00:03:32,979
نمونه سازی سریع تحقیقات و
86
00:03:32,979 –> 00:03:35,560
تولید پیشرفته با سه مزیت کلیدی استفاده می شود
87
00:03:35,560 –> 00:03:37,900
اول از همه کاربر پسند است،
88
00:03:37,900 –> 00:03:40,209
بنابراین clears دارای یک رابط کاربری ساده و سازگار
89
00:03:40,209 –> 00:03:42,790
بهینه شده برای موارد استفاده رایج
90
00:03:42,790 –> 00:03:44,739
است و بازخورد واضح و عملی
91
00:03:44,739 –> 00:03:47,680
را برای خطاهای کاربر ارائه
92
00:03:47,680 –> 00:03:50,709
می دهد.
93
00:03:50,709 –> 00:03:53,199
ساخته شده با اتصال بلوک های ساختمانی قابل تنظیم به
94
00:03:53,199 –> 00:03:54,879
یکدیگر با محدودیت های کمی
95
00:03:54,879 –> 00:03:58,299
و مزیت سوم گسترش آسان است،
96
00:03:58,299 –> 00:04:00,819
اکنون می توانیم بلوک های ساختمانی سفارشی را
97
00:04:00,819 –> 00:04:02,769
برای بیان ایده های جدید برای تحقیق
98
00:04:02,769 –> 00:04:05,739
99
00:04:05,739 –> 00:04:08,409
100
00:04:08,409 –> 00:04:09,849
بنویسیم. از همه کارهایی که میخواهیم انجام دهیم این است
101
00:04:09,849 –> 00:04:13,239
که مجموعه دادههای مد MN است DT را وارد کنیم، بنابراین از مجموعه داده
102
00:04:13,239 –> 00:04:15,189
مد MN is T استفاده میکنیم
103
00:04:15,189 –> 00:04:17,738
که شامل 70 است. 000
104
00:04:17,738 –> 00:04:20,620
تصویر در مقیاس کر در ده دسته اکنون
105
00:04:20,620 –> 00:04:22,900
تصاویر تک تک
106
00:04:22,900 –> 00:04:25,300
لباس ها را با وضوح پایین نشان می دهد که 28
107
00:04:25,300 –> 00:04:28,599
در 28 پیکسل است، همانطور که اکنون می توانید اینجا ببینید
108
00:04:28,599 –> 00:04:31,810
که چه کار می کنیم ما از 60000 تصویر
109
00:04:31,810 –> 00:04:34,210
برای آموزش شبکه استفاده خواهیم کرد و 10000 تصویر باقی مانده
110
00:04:34,210 –> 00:04:36,310
استفاده خواهد شد. برای ارزیابی اینکه
111
00:04:36,310 –> 00:04:38,740
شبکه با
112
00:04:38,740 –> 00:04:41,229
چه دقتی طبقهبندی تصاویر را یاد گرفته است، اکنون کاری که میتوانید انجام دهید این
113
00:04:41,229 –> 00:04:41,860
است
114
00:04:41,860 –> 00:04:44,080
که مستقیماً از tensorflow از M&A مد استفاده کنید،
115
00:04:44,080 –> 00:04:47,140
فقط دادهها را وارد کرده و بارگذاری کنید،
116
00:04:47,140 –> 00:04:51,040
بنابراین کاری که من میخواهم انجام دهم این است که یک
117
00:04:51,040 –> 00:04:53,260
دفترچه یادداشت Python در اینجا ایجاد کنم. نام
118
00:04:53,260 –> 00:04:55,710
آن را به
119
00:05:09,659 –> 00:05:11,830
این صورت میگذارم، من آن را بهعنوان طبقهبندی تصویر میگذارم،
120
00:05:11,830 –> 00:05:19,719
مد MN است T
121
00:05:19,719 –> 00:05:21,999
اولین چیزی که دادهها را بارگیری میکنیم، کاری که
122
00:05:21,999 –> 00:05:24,819
میخواهیم انجام دهیم این است که tensorflow را وارد میکنیم
123
00:05:24,819 –> 00:05:28,749
و Kira را وارد میکنیم، بنابراین ما میخواهیم
124
00:05:28,749 –> 00:05:31,119
import tensorflow stf از tensorflow
125
00:05:31,119 –> 00:05:33,399
ما Kira را وارد می کنیم و
126
00:05:33,399 –> 00:05:35,379
چند کتابخانه مفید
127
00:05:35,379 –> 00:05:38,800
مانند numpy و matplotlib را وارد می کنیم و برای بررسی
128
00:05:38,800 –> 00:05:40,119
نسخه یا tensorflow
129
00:05:40,119 –> 00:05:45,009
در اینجا 1.9 داریم بنابراین کاری که می
130
00:05:45,009 –> 00:05:47,709
خواهیم انجام دهیم این است که داده ها را بارگذاری کنیم تا شما
131
00:05:47,709 –> 00:05:48,939
می توانید اینجا ما را ببینید از کلید
132
00:05:48,939 –> 00:05:51,399
بازیابی مجموعه دادههای نقطه مد M&I استفاده
133
00:05:51,399 –> 00:05:53,610
میکنند، زیرا از قبل در Kira وجود دارد و
134
00:05:53,610 –> 00:05:56,680
مجموعه دادهها را برای آرایههای numpy بارگیری میکند،
135
00:05:56,680 –> 00:05:59,229
اکنون تصاویر قطار و
136
00:05:59,229 –> 00:06:01,389
آرایههای برچسب قطار
137
00:06:01,389 –> 00:06:04,029
مجموعه دادههای آموزشی هستند و اینها دادههایی هستند
138
00:06:04,029 –> 00:06:06,999
که مدل از آنها استفاده میکند. بیاموزید که مدل در
139
00:06:06,999 –> 00:06:09,459
برابر مجموعه آزمایشی آزمایش می شود
140
00:06:09,459 –> 00:06:12,159
که تصاویر آزمایشی و برچسب آزمایشی Ares هستند
141
00:06:12,159 –> 00:06:15,610
اکنون تصاویر 28 در 28 عددی توسط Ares
142
00:06:15,610 –> 00:06:17,949
با مقادیر پیکسلی بین 0 تا
143
00:06:17,949 –> 00:06:18,789
255 هستند و
144
00:06:18,789 –> 00:06:22,419
اکنون برچسب ها آرایه ای از اعداد صحیح
145
00:06:22,419 –> 00:06:25,539
از 0 تا 9 هستند. و اینها
146
00:06:25,539 –> 00:06:27,339
با کلاس لباسی که تصویر
147
00:06:27,339 –> 00:06:30,309
نشان می دهد مطابقت دارد اکنون هر تصویر به
148
00:06:30,309 –> 00:06:32,860
یک برچسب نگاشت شده است زیرا نام کلاس ها در
149
00:06:32,860 –> 00:06:35,259
مجموعه داده گنجانده نشده است که باید
150
00:06:35,259 –> 00:06:37,300
آنها را در اینجا ذخیره کنیم تا بعداً هنگام
151
00:06:37,300 –> 00:06:39,490
ترسیم تصاویر از آنها استفاده کنیم.
152
00:06:39,490 –> 00:06:41,289
برای انجام این کار این است که نام کلاس ها را تعریف کنیم
153
00:06:41,289 –> 00:06:45,249
تا مرورگر تی شرت را در زیر کد لباس
154
00:06:45,249 –> 00:06:48,849
San and پیراهن کیف کتانی و نیم
155
00:06:48,849 –> 00:06:51,669
بوت شما داشته باشیم، بنابراین پس از بارگیری داده ها، اجازه دهید
156
00:06:51,669 –> 00:06:54,279
قالب داده یا مجموعه خواننده
157
00:06:54,279 –> 00:06:56,559
قبل از آموزش را بررسی کنیم. g صبح، همانطور
158
00:06:56,559 –> 00:06:58,719
که از کد زیر می بینید،
159
00:06:58,719 –> 00:07:01,269
نشان می دهد که ما 60000 تصویر در
160
00:07:01,269 –> 00:07:04,059
مجموعه آموزشی داریم که هر تصویر
161
00:07:04,059 –> 00:07:07,930
با ابعاد 28 در 28 پیکسل نشان داده شده است، همچنین
162
00:07:07,930 –> 00:07:09,879
60000 برچسب در مجموعه داده آموزشی وجود دارد
163
00:07:09,879 –> 00:07:13,959
و اگر در مورد برچسب صحبت کنید، این است. یک
164
00:07:13,959 –> 00:07:16,930
عدد صحیح بین 0 تا 9 بنابراین همانطور که
165
00:07:16,930 –> 00:07:19,719
در اینجا می بینید آرایه ای است که از 9 شروع می شود
166
00:07:19,719 –> 00:07:22,159
که 0 0 3 0 5 است
167
00:07:22,159 –> 00:07:25,399
و 10000 تصویر در مجموعه آزمایشی وجود دارد
168
00:07:25,399 –> 00:07:28,459
که هر یک از تصاویر به
169
00:07:28,459 –> 00:07:32,839
صورت 28 به علاوه 28 پیکسل و 10000 تصویر وجود دارد.
170
00:07:32,839 –> 00:07:35,509
تصاویر به این صورت برچسب گذاری شده اند قبل از پردازش، کاری
171
00:07:35,509 –> 00:07:37,360
که باید انجام دهیم این است که اکنون داده ها را از قبل پردازش کنیم،
172
00:07:37,360 –> 00:07:40,789
اگر اولین تصویر را در
173
00:07:40,789 –> 00:07:43,279
مجموعه آموزشی بررسی کنید، خواهید دید که
174
00:07:43,279 –> 00:07:45,589
مقادیر پیکسل تصویر در محدوده
175
00:07:45,589 –> 00:07:46,819
0 تا 255 قرار می گیرند،
176
00:07:46,819 –> 00:07:50,899
اکنون ما این مقادیر را در محدوده مقیاس بندی می کنیم. از 0
177
00:07:50,899 –> 00:07:53,059
به 1 و قبل از تغذیه به
178
00:07:53,059 –> 00:07:55,550
مدل شبکه عصبی برای این کار،
179
00:07:55,550 –> 00:07:58,639
مقادیر را بر 255 تقسیم می کنیم، بنابراین مهم است که
180
00:07:58,639 –> 00:08:01,219
مجموعه آموزشی و مجموعه آزمایشی
181
00:08:01,219 –> 00:08:03,319
به همان روشی از قبل پردازش شوند که
182
00:08:03,319 –> 00:08:06,229
اکنون واقعاً مهم است که کاری که
183
00:08:06,229 –> 00:08:09,860
میخواهیم انجام دهیم این است. برای نمایش th 25 تصویر اول
184
00:08:09,860 –> 00:08:12,229
از مجموعه آموزشی و نمایش
185
00:08:12,229 –> 00:08:14,809
نام کلاس در زیر هر تصویر و
186
00:08:14,809 –> 00:08:17,990
کاری که ما انجام خواهیم داد این است که بررسی کنیم آیا
187
00:08:17,990 –> 00:08:20,449
فرمت داده ها درست است و بعد از
188
00:08:20,449 –> 00:08:22,159
آن آماده ساختن ورودی در شبکه هستیم،
189
00:08:22,159 –> 00:08:26,349
بنابراین اجازه دهید فقط نمایش داده شود. تصاویر
190
00:08:30,770 –> 00:08:33,470
و اکنون به ساخت مدل میرسد، بنابراین
191
00:08:33,470 –> 00:08:35,179
بیلی شبکه عصبی نیاز به
192
00:08:35,179 –> 00:08:37,460
پیکربندی لایههای مدل و
193
00:08:37,460 –> 00:08:40,280
سپس کامپایل مدل دارد، بنابراین بیایید
194
00:08:40,280 –> 00:08:46,130
ابتدا لایهها را تنظیم کنیم، نه اینکه
195
00:08:46,130 –> 00:08:47,840
بلوک اصلی یک شبکه عصبی یک لایه
196
00:08:47,840 –> 00:08:50,930
لایهای است که نمایشهایی را از
197
00:08:50,930 –> 00:08:53,360
دادهها استخراج میکند. به آنها وارد شده است و امیدواریم که
198
00:08:53,360 –> 00:08:55,790
این نمایشها
199
00:08:55,790 –> 00:08:58,490
برای مسئله مورد نظر معنیدارتر باشند، اکنون بیشتر
200
00:08:58,490 –> 00:09:00,170
یادگیری عمیق شامل زنجیر کردن
201
00:09:00,170 –> 00:09:03,290
لایههای ساده است.
202
00:09:03,290 –> 00:09:05,690
203
00:09:05,690 –> 00:09:07,550
204
00:09:07,550 –> 00:09:09,500
در اینجا
205
00:09:09,500 –> 00:09:11,840
ما مدل خود را داریم که متوالی ستاره مقیاس است
206
00:09:11,840 –> 00:09:14,330
و از لایه های متراکم صاف و دست استفاده می کنیم،
207
00:09:14,330 –> 00:09:16,370
بنابراین می توانید شکل ورودی
208
00:09:16,370 –> 00:09:19,730
28 متقاطع 28 است پس غلط لایه
209
00:09:19,730 –> 00:09:23,030
در این شبکه که همان لایه شطرنجی TFK است که
210
00:09:23,030 –> 00:09:25,940
شروع به صاف کردن می کند،
211
00:09:25,940 –> 00:09:29,030
فرمت تصاویر را از یک آرایه 2 بعدی یا
212
00:09:29,030 –> 00:09:33,170
28 در 28 به یک آرایه 1 بعدی با هزینه 28 تبدیل می کند،
213
00:09:33,170 –> 00:09:36,050
وقتی هوا که 784 پیکسل است
214
00:09:36,050 –> 00:09:38,510
این لایه را به عنوان ردیف های پیکسل از هم جدا می کند.
215
00:09:38,510 –> 00:09:41,780
در تصویر و ردیف کردن آنها اکنون این
216
00:09:41,780 –> 00:09:44,300
لایه هیچ پارامتری برای یادگیری ندارد و فقط
217
00:09:44,300 –> 00:09:47,270
داده ها را مجدداً فرمت می کند اکنون پس از
218
00:09:47,270 –> 00:09:49,280
مسطح شدن پیکسل ها شبکه از یک
219
00:09:49,280 –> 00:09:52,370
دنباله از دو لایه متراکم تشکیل شده است که اکنون این لایه ها
220
00:09:52,370 –> 00:09:54,710
به طور متراکم یا
221
00:09:54,710 –> 00:09:56,900
لایه های عصبی کاملاً متصل هستند بنابراین اولین متراکم است. لایه
222
00:09:56,900 –> 00:10:00,440
دارای 128 گره یا اساساً 128 نورون است
223
00:10:00,440 –> 00:10:02,810
در حالی که لایه دوم یا آخرین دارای
224
00:10:02,810 –> 00:10:05,930
10 گره با لایه softmax است و این
225
00:10:05,930 –> 00:10:08,690
آرایه ای از 10 امتیاز احتمالاً T را برمی گرداند
226
00:10:08,690 –> 00:10:12,410
که مجموع آنها به 1 می رسد اکنون هر گره دارای
227
00:10:12,410 –> 00:10:13,910
امتیازی است که نشان دهنده احتمال
228
00:10:13,910 –> 00:10:16,460
تعلق تصویر فعلی است. به یکی از
229
00:10:16,460 –> 00:10:19,130
آن 10 کلاس، بنابراین کاری که
230
00:10:19,130 –> 00:10:21,470
میخواهیم انجام دهیم این است که مدل را کامپایل کنیم، بنابراین
231
00:10:21,470 –> 00:10:23,300
قبل از اینکه مدل برای آموزش آماده شود، به
232
00:10:23,300 –> 00:10:27,380
تنظیمات بیشتری نیاز دارد، اکنون این تنظیمات در
233
00:10:27,380 –> 00:10:30,110
طول کامپوزیت مدلها اضافه میشوند. مرحله ile بنابراین
234
00:10:30,110 –> 00:10:32,000
برای مثال ما تابع ضرر داریم
235
00:10:32,000 –> 00:10:34,760
که میزان دقت مدل را در طول آموزش اندازه گیری می کند
236
00:10:34,760 –> 00:10:36,530
و می خواهیم
237
00:10:36,530 –> 00:10:38,780
عملکرد را به حداقل برسانیم تا مدل را
238
00:10:38,780 –> 00:10:40,180
در جهت درست ببینیم
239
00:10:40,180 –> 00:10:42,800
یکی دیگر از جنبه های مهم
240
00:10:42,800 –> 00:10:44,380
بهینه ساز است،
241
00:10:44,380 –> 00:10:46,270
بنابراین مدل بر اساس این به روز رسانی می شود. در مورد داده هایی
242
00:10:46,270 –> 00:10:48,930
که می بیند و عملکرد از دست دادن آن و
243
00:10:48,930 –> 00:10:51,070
در نهایت ما معیارهایی داریم
244
00:10:51,070 –> 00:10:53,110
که برای نظارت بر مراحل آموزش و آزمایش استفاده می
245
00:10:53,110 –> 00:10:55,300
شود و مثال زیر از دقت استفاده می کند
246
00:10:55,300 –> 00:10:57,370
که کسری از
247
00:10:57,370 –> 00:10:59,950
تصاویر است که به درستی طبقه بندی شده اند، بنابراین
248
00:10:59,950 –> 00:11:02,850
بچه ها اکنون ما می خواهیم آن را تمیز کنیم. مدل پس
249
00:11:02,850 –> 00:11:05,320
بیاورید مدل شبکه عصبی به
250
00:11:05,320 –> 00:11:07,570
مراحلی نیاز دارد که اولین مرحله تغذیه
251
00:11:07,570 –> 00:11:09,970
داده های آموزشی به مدل است و در
252
00:11:09,970 –> 00:11:12,310
این مثال تصاویر زیر خط
253
00:11:12,310 –> 00:11:13,870
قطار و پاک کردن برچسب قطار و مدرسه
254
00:11:13,870 –> 00:11:16,420
است و پس از آن مدل
255
00:11:16,420 –> 00:11:18,880
یاد می گیرد که تصاویر را مرتبط کند. l برچسب
256
00:11:18,880 –> 00:11:20,830
می زند و بعد از آن از او خواستیم که
257
00:11:20,830 –> 00:11:23,800
در مورد یک مجموعه تست در
258
00:11:23,800 –> 00:11:25,540
این مثال که
259
00:11:25,540 –> 00:11:28,060
آرایه تصاویر زیر خط تست است پیش بینی کند و کاری که ما انجام می دهیم این
260
00:11:28,060 –> 00:11:30,400
است که بررسی کنیم fy که پیشبینی
261
00:11:30,400 –> 00:11:32,050
با برچسبهای آزمون مطابقت داشت و
262
00:11:32,050 –> 00:11:34,990
آرایه برچسب مدرسه برای شروع آموزش، کاری که
263
00:11:34,990 –> 00:11:36,670
میخواهیم انجام دهیم این است که روش نقطهای مدل
264
00:11:36,670 –> 00:11:39,520
phred را فراخوانی کنیم و مدل با دادههای آموزشی مطابقت دارد،
265
00:11:39,520 –> 00:11:42,430
بنابراین همانطور که میبینید اینجا هستیم.
266
00:11:42,430 –> 00:11:45,160
انجام دادن مدل نقطه فیت و در این که
267
00:11:45,160 –> 00:11:46,870
ما به قطار و تصاویر امتیاز داده ایم
268
00:11:46,870 –> 00:11:49,330
برچسب قطار و دوره
269
00:11:49,330 –> 00:11:53,230
هایی را که ذکر کردیم 5 است بنابراین به جای
270
00:11:53,230 –> 00:11:55,750
5 آن را برای 10 I جعبه آموزش می دهم تا
271
00:11:55,750 –> 00:11:57,220
ببینم آیا تغییراتی وجود دارد یا خیر.
272
00:11:57,220 –> 00:11:59,950
من قبلاً این مدل را یک بار
273
00:11:59,950 –> 00:12:04,480
با 5 دوره اجرا می کنم، به طوری که مدل ضرر را آموزش می دهد
274
00:12:04,480 –> 00:12:06,430
و معیارهای دقت در
275
00:12:06,430 –> 00:12:09,130
اینجا نمایش داده می شود، بنابراین همانطور که می بینید در
276
00:12:09,130 –> 00:12:12,880
اینجا اولین دوره تلفات 0.5 است در حالی
277
00:12:12,880 –> 00:12:14,920
که دقت 0.82 است
278
00:12:14,920 –> 00:12:18,160
و به 1/10 Eibach کاهش می یابد.
279
00:12:18,160 –> 00:12:21,970
در اینجا می توانید ببینید که ضرر 0.24 است که
280
00:12:21,970 –> 00:12:24,670
از 0.5 کاهش یافته است و
281
00:12:24,670 –> 00:12:29,680
دقت از 82٪ به 91٪ افزایش یافته است، اکنون
282
00:12:29,680 –> 00:12:31,630
آنچه که ما می خواهیم انجام دهیم ارزیابی
283
00:12:31,630 –> 00:12:34,270
دقت است، بنابراین اکنون می خواهیم نحوه عملکرد مدل را با هم مقایسه
284
00:12:34,270 –> 00:12:36,340
کنیم. مجموعه داده های آزمایشی
285
00:12:36,340 –> 00:12:38,980
را می توانید در اینجا ببینید
286
00:12:38,980 –> 00:12:43,000
دقت 0.88 است که 84 درصد است حالا
287
00:12:43,000 –> 00:12:45,430
معلوم می شود که دقت
288
00:12:45,430 –> 00:12:47,560
تست کمی کمتر از دقت
289
00:12:47,560 –> 00:12:49,750
در نیاز آموزشی است که گفتم حالا این شکاف
290
00:12:49,750 –> 00:12:52,090
بین دقت تمرین و
291
00:12:52,090 –> 00:12:54,130
دقت تست نمونه ای از
292
00:12:54,130 –> 00:12:55,030
293
00:12:55,030 –> 00:12:57,100
overfitting است بنابراین اضافه برازش زمانی است که یک
294
00:12:57,100 –> 00:12:59,530
مدل یادگیری ماشینی روی
295
00:12:59,530 –> 00:13:02,350
دادههای جدید بدتر از دادههای آموزشی عمل میکند، بنابراین کاری
296
00:13:02,350 –> 00:13:03,700
که ما میخواهیم انجام دهیم این است که اکنون پیشبینی کنیم،
297
00:13:03,700 –> 00:13:06,310
بنابراین با قطار مدل
298
00:13:06,310 –> 00:13:08,350
میتوانیم از آن برای پیشبینی برخی از
299
00:13:08,350 –> 00:13:10,770
تصاویر استفاده کنیم، بنابراین آنچه میخواهیم انجام دهیم.
300
00:13:10,770 –> 00:13:13,300
پیشبینی برابر است با کوچک یا پیشبینی و
301
00:13:13,300 –> 00:13:15,580
ما نمیتوانیم از تصاویر زیر خط تست استفاده کنیم،
302
00:13:15,580 –> 00:13:18,220
بنابراین در اینجا مدل برچسب را
303
00:13:18,220 –> 00:13:20,860
برای هر تصویر در مجموعه آزمایشی نصب کرده است، بنابراین
304
00:13:20,860 –> 00:13:22,450
بیایید به اولین پیشبینی نگاهی بیندازیم
305
00:13:22,450 –> 00:13:24,370
تا همانطور که میبینید در
306
00:13:24,370 –> 00:13:27,430
اینجا یک پیشبینی آرایهای از اکنون 10 عدد
307
00:13:27,430 –> 00:13:29,680
این اطمینان
308
00:13:29,680 –> 00:13:31,840
مدل را نشان می دهد که تصویر مربوط به هر یک
309
00:13:31,840 –> 00:13:33,760
از 10 محصول مختلف لباس است،
310
00:13:33,760 –> 00:13:36,310
بنابراین ما می توانیم ببینیم که کدام برچسب
311
00:13:36,310 –> 00:13:39,330
بالاترین میزان اطمینان را دارد،
312
00:13:39,370 –> 00:13:41,410
بنابراین می توانید خروجی را در اینجا ببینید.
313
00:13:41,410 –> 00:13:43,810
گرفتن 9 است بنابراین مدل با اطمینان بیشتر زندگی می کند
314
00:13:43,810 –> 00:13:45,790
که تصویر یک نیم
315
00:13:45,790 –> 00:13:48,730
بوت یا کلاس شماره نه است، بنابراین بیایید
316
00:13:48,730 –> 00:13:51,460
ببینیم و بررسی کنیم که آیا برچسب تست
317
00:13:51,460 –> 00:13:54,220
این را به عنوان خروجی صحیح می بیند، بنابراین همانطور که می
318
00:13:54,220 –> 00:13:56,710
توانید اینجا ببینید برچسب تست هم اکنون 9 است
319
00:13:56,710 –> 00:13:59,290
ما میتوانیم این نمودار را برای مشاهده
320
00:13:59,290 –> 00:14:02,680
مجموعه کامل ده کانال ترسیم کنیم، بنابراین همانطور که میبینید
321
00:14:02,680 –> 00:14:05,230
در اینجا ما تصویر نمودار
322
00:14:05,230 –> 00:14:08,320
را تعریف کردهایم و آرایه ارزش نمودار را تعریف کردهایم، بنابراین
323
00:14:08,320 –> 00:14:10,720
بیایید ابتدا به پیشبینی تصویر صفر
324
00:14:10,720 –> 00:14:12,580
و آرایه پیشبینی نگاه کنیم
325
00:14:12,580 –> 00:14:17,170
تا بتوانید. اینجا را ببینید ما یک
326
00:14:17,170 –> 00:14:19,960
نیم بوت داریم که صد در صد طبقه بندی شده است
327
00:14:19,960 –> 00:14:23,040
و اگر به
328
00:14:23,040 –> 00:14:27,480
تصویر دوازدهم در اینجا نگاهی بیندازیم همانطور که می توانید اینجا ببینید
329
00:14:27,480 –> 00:14:29,770
ابتدا به تصویر پانزدهم نگاهی بیندازیم
330
00:14:29,770 –> 00:14:32,740
و اکنون با نگاهی به تصویر دهم
331
00:14:32,740 –> 00:14:34,750
می توانیم ببینیم. در اینجا نقل قول 90٪
332
00:14:34,750 –> 00:14:38,140
کد است، اما به عنوان یک دسته دیگر نیز تعریف شده است،
333
00:14:38,140 –> 00:14:42,400
حالا اجازه دهید چندین تصویر را
334
00:14:42,400 –> 00:14:44,860
با پیش بینی ها ترسیم کنیم و
335
00:14:44,860 –> 00:14:47,200
برچسب های پیش بینی درست سبز هستند و
336
00:14:47,200 –> 00:14:51,220
برچسب های پیش بینی نادرست آماده هستند،
337
00:14:51,220 –> 00:14:53,380
بنابراین عدد درصد فعلی را نشان می دهد.
338
00:14:53,380 –> 00:14:55,600
t از 100 برای برچسب پیش بینی شده و
339
00:14:55,600 –> 00:14:58,600
توجه داشته باشید که ممکن است اشتباه باشد حتی اگر ما
340
00:14:58,600 –> 00:15:01,270
بسیار بسیار مطمئن باشیم، بنابراین همانطور که
341
00:15:01,270 –> 00:15:04,270
در اینجا می بینید بسیاری از این تصاویر 100٪
342
00:15:04,270 –> 00:15:06,550
درست هستند، اما گاهی اوقات همانطور که
343
00:15:06,550 –> 00:15:08,500
در اینجا می بینید کفش ورزشی به عنوان صندل طبقه بندی می شود.
344
00:15:08,500 –> 00:15:10,870
اما در واقع کفشهای
345
00:15:10,870 –> 00:15:14,740
کتانی شل نشده بهعنوان یک صندل 88 درصدی هستند، بنابراین این یک
346
00:15:14,740 –> 00:15:17,080
پیشبینی بسیار نادرست است، همچنین
347
00:15:17,080 –> 00:15:19,089
اگر به کدی که 77 درصد کد است نگاهی بیندازیم،
348
00:15:19,089 –> 00:15:21,490
آن را به عنوان عناصر دیگر طبقهبندی کرده است
349
00:15:21,490 –> 00:15:24,310
، در نهایت کاری که میخواهیم
350
00:15:24,310 –> 00:15:26,440
انجام دهیم این است. از مدل Train برای
351
00:15:26,440 –> 00:15:29,640
پیشبینی یک تصویر استفاده کنید، بنابراین
352
00:15:29,640 –> 00:15:33,640
بیایید ابتدا بررسی کنیم، بیایید تصویر را از
353
00:15:33,640 –> 00:15:37,000
مجموعه دادهها بگیریم تا کاری که انجام میدهیم این است که من هستم G
354
00:15:37,000 –> 00:15:39,339
برابر NP گسترش مییابد، شما ابعاد را دریافت میکنید
355
00:15:39,339 –> 00:15:43,680
تا همانطور که میبینید در اینجا 28 کاما 28 است.
356
00:15:43,680 –> 00:15:46,779
مدل TF dot Kiera
357
00:15:46,779 –> 00:15:48,550
برای پیشبینی روی یک وصله یا
358
00:15:48,550 –> 00:15:51,160
مجموعهای از نمونهها بهطور همزمان بهینهسازی شده است، بنابراین حتی
359
00:15:51,160 –> 00:15:52,690
اگر از یک تصویر استفاده میکنیم،
360
00:15:52,690 –> 00:15:53,240
باید
361
00:15:53,240 –> 00:15:55,940
آن را به لیست اضافه کنیم، همانطور که در اینجا میبینید
362
00:15:55,940 –> 00:15:57,380
، تصویر را به دسته اضافه میکنیم.
363
00:15:57,380 –> 00:16:00,440
جایی که این تنها عضو است، بنابراین اکنون
364
00:16:00,440 –> 00:16:02,360
چه هستیم کاری که باید انجام داد پیش بینی تصویر است
365
00:16:02,360 –> 00:16:05,959
و همانطور که در اینجا می بینید
366
00:16:05,959 –> 00:16:09,260
پیش بینی نقطه مدل لیستی از لیست های یکی از
367
00:16:09,260 –> 00:16:12,170
هر تصویر در دسته داده ها را برمی گرداند، اکنون
368
00:16:12,170 –> 00:16:14,810
بیایید پیش بینی های تنها
369
00:16:14,810 –> 00:16:17,330
تصویر خود را در دسته جمع آوری کنیم تا همانطور که می توانید
370
00:16:17,330 –> 00:16:20,9