در این مطلب، ویدئو نحوه ساخت مدل های ترانسفورماتور پرسش و پاسخ سفارشی در پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 1:10:15
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,080 –> 00:00:02,639
سلام و به ویدیوی امروز خوش آمدید، ما
2
00:00:02,639 –> 00:00:03,199
قصد
3
00:00:03,199 –> 00:00:06,480
داریم نحوه تنظیم دقیق یک مدل تبدیل q را بررسی
4
00:00:06,480 –> 00:00:07,839
کنیم،
5
00:00:07,839 –> 00:00:11,120
بنابراین برای کسانی از شما که نمی دانند q
6
00:00:11,120 –> 00:00:11,599
a فقط
7
00:00:11,599 –> 00:00:14,559
به معنای پاسخ به سؤال است و یکی از
8
00:00:14,559 –> 00:00:14,960
9
00:00:14,960 –> 00:00:18,240
بزرگترین موضوعات در nlp در حال حاضر است.
10
00:00:18,240 –> 00:00:19,199
11
00:00:19,199 –> 00:00:21,199
مدلهای زیادی وجود دارد که در آنها سؤالی را میپرسید
12
00:00:21,199 –> 00:00:22,400
13
00:00:22,400 –> 00:00:25,519
و به شما پاسخ میدهد
14
00:00:25,519 –> 00:00:28,880
و یکی از بزرگترین چیزهایی است که
15
00:00:28,880 –> 00:00:30,400
باید بدانید
16
00:00:30,400 –> 00:00:32,238
که چگونه هنگام کار با
17
00:00:32,238 –> 00:00:34,559
ترانسفورماتور، چه q a یا
18
00:00:34,559 –> 00:00:37,360
هر یک از راهحلهای دیگر مبتنی بر ترانسفورماتور انجام دهید.
19
00:00:37,360 –> 00:00:38,640
20
00:00:38,640 –> 00:00:42,640
این است که چگونه آنها را به درستی تنظیم کنیم، بنابراین
21
00:00:42,640 –> 00:00:43,840
این همان کاری است که ما در
22
00:00:43,840 –> 00:00:45,840
این ویدیو انجام خواهیم داد،
23
00:00:45,840 –> 00:00:47,600
ما می خواهیم نحوه تنظیم دقیق
24
00:00:47,600 –> 00:00:50,719
یک مدل ترانسفورماتور q را
25
00:00:50,719 –> 00:00:53,840
در پایتون بررسی کنیم، بنابراین فکر می کنم
26
00:00:53,840 –> 00:00:56,559
واقعا جالب است و فکر می کنم
27
00:00:56,559 –> 00:00:57,520
از آن لذت خواهید برد. خیلی زیاد است،
28
00:00:57,520 –> 00:01:00,000
پس بیایید ادامه دهیم و می توانیم
29
00:01:00,000 –> 00:01:01,120
30
00:01:01,120 –> 00:01:04,319
خوب شروع کنیم، بنابراین اولین کاری که باید انجام دهیم این است که
31
00:01:04,319 –> 00:01:05,280
در واقع
32
00:01:05,280 –> 00:01:08,799
داده های خود را دانلود کنیم، بنابراین
33
00:01:08,799 –> 00:01:09,680
از
34
00:01:09,680 –> 00:01:12,640
مجموعه داده های تیم استفاده می کنیم که
35
00:01:12,640 –> 00:01:14,320
مجموعه داده پاسخ به سؤالات استنفورد
36
00:01:14,320 –> 00:01:16,400
است که اساساً یکی از مجموع داده های
37
00:01:16,400 –> 00:01:17,759
شناخته شده q a
38
00:01:17,759 –> 00:01:20,240
موجود است که می توانیم از آن برای
39
00:01:20,240 –> 00:01:22,320
تنظیم دقیق مدل خود استفاده کنیم،
40
00:01:22,320 –> 00:01:27,840
بنابراین بیایید ابتدا پوشه ای ایجاد
41
00:01:28,720 –> 00:01:31,840
کنیم که از os
42
00:01:32,479 –> 00:01:36,720
و os استفاده می کند و در
43
00:01:37,040 –> 00:01:40,000
آنجا فقط آن را squad می نامیم، بدیهی است که می
44
00:01:40,000 –> 00:01:42,479
دانید این را صدا بزنید و آن را همانطور که می خواهید سازماندهی کنید
45
00:01:42,479 –> 00:01:45,840
این کاری است که اکنون انجام خواهم داد، آدرس اینترنتی
46
00:01:45,840 –> 00:01:47,759
که قرار است این را از آن دانلود کنیم
47
00:01:47,759 –> 00:01:48,880
48
00:01:48,880 –> 00:01:51,600
49
00:01:52,000 –> 00:01:54,399
مشکلی ندارد و در واقع دو فایل
50
00:01:54,399 –> 00:01:56,159
در اینجا وجود دارد که ما آنها را دانلود خواهیم کرد
51
00:01:56,159 –> 00:01:57,840
و هر دو از
52
00:01:57,840 –> 00:02:00,560
یک آدرس اینترنتی می
53
00:02:00,560 –> 00:02:03,040
آیند، زیرا ما در حال ارسال درخواست به url
54
00:02:03,040 –> 00:02:03,680
ما
55
00:02:03,680 –> 00:02:08,318
درخواستهایی را وارد میکنیم، همچنین میتوانیم از کتابخانه wget نیز استفاده کنیم
56
00:02:08,318 –> 00:02:10,080
یا اگر از لینوکس استفاده
57
00:02:10,080 –> 00:02:12,239
میکنید، میتوانید مستقیماً از wget
58
00:02:12,239 –> 00:02:14,160
در ترمینال استفاده کنید، این به شما بستگی دارد،
59
00:02:14,160 –> 00:02:22,480
اما ما میخواهیم استفاده از درخواستها
60
00:02:22,480 –> 00:02:25,760
خوب است و برای درخواست دادههای خود،
61
00:02:25,760 –> 00:02:28,800
این کار را انجام
62
00:02:28,879 –> 00:02:32,160
میدهیم، بنابراین فقط یک درخواست دریافت است که
63
00:02:33,200 –> 00:02:36,800
از رشته f استفاده کنید و ما آدرس اینترنتی را
64
00:02:36,800 –> 00:02:38,800
داریم که قبلاً تعریف کردهایم
65
00:02:38,800 –> 00:02:41,360
و سپس دادههای آموزشی که استفاده خواهیم کرد
66
00:02:41,360 –> 00:02:42,080
67
00:02:42,080 –> 00:02:51,840
این است در اینجا فایل را ثبت کنید.
68
00:02:51,840 –> 00:02:54,800
درخواستها
69
00:02:56,800 –> 00:02:58,159
خوب است و ما میتوانیم ببینیم که با موفقیت این کار را انجام
70
00:02:58,159 –> 00:03:01,280
دادهایم این دادهها
71
00:03:01,280 –> 00:03:03,680
خوب است، بنابراین همانطور که قبلاً گفتم در
72
00:03:03,680 –> 00:03:04,959
واقع
73
00:03:04,959 –> 00:03:07,040
دو تا از این فایلها وجود دارد که میخواهیم آنها را
74
00:03:07,040 –> 00:03:08,640
استخراج کنیم،
75
00:03:08,640 –> 00:03:10,720
بنابراین کاری که من میخواهم انجام دهم این است که فقط این
76
00:03:10,720 –> 00:03:11,840
را در یک حلقه for قرار دهم
77
00:03:11,840 –> 00:03:16,400
که از هر دوی آنها عبور میکند، فقط آن را
78
00:03:17,840 –> 00:03:21,280
کپی کرده و در آن جایگذاری کنید.
79
00:03:22,480 –> 00:03:25,519
تغییر نام این فایل
80
00:03:30,400 –> 00:03:33,200
و فایل دیگر یکسان است، اما
81
00:03:33,200 –> 00:03:35,120
به جای Train، ما dev
82
00:03:35,120 –> 00:03:39,120
Okay داریم، بنابراین در اینجا درخواست خود را میکنیم
83
00:03:40,400 –> 00:03:42,239
و سپس کاری که میخواهیم
84
00:03:42,239 –> 00:03:43,760
بعد از درخواست انجام دهیم این است
85
00:03:43,760 –> 00:03:47,920
که این فایل را در درایو خود ذخیره
86
00:03:47,920 –> 00:03:50,319
کنیم. میخواهیم آن را در این
87
00:03:50,319 –> 00:03:50,959
88
00:03:50,959 –> 00:03:54,720
پوشه squad در اینجا قرار دهیم، برای این کار
89
00:03:54,720 –> 00:03:58,000
از open استفاده
90
00:03:58,239 –> 00:04:00,000
میکنیم و دوباره از یک رشته f
91
00:04:00,000 –> 00:04:02,319
در اینجا استفاده
92
00:04:03,120 –> 00:04:05,519
میکنیم و آن را در داخل
93
00:04:05,519 –> 00:04:07,120
94
00:04:07,120 –> 00:04:10,080
پوشه squad اینجا قرار میدهیم و سپس در اینجا فقط میخواهیم
95
00:04:10,080 –> 00:04:11,680
خود را قرار دهیم. نام فایل
96
00:04:11,680 –> 00:04:15,120
که فایل است اکنون
97
00:04:15,120 –> 00:04:16,959
ما این را به صورت باینری می نویسیم
98
00:04:16,959 –> 00:04:18,959
زیرا json است، بنابراین wb را
99
00:04:18,959 –> 00:04:22,079
برای پروازهای خود در اینجا
100
00:04:22,079 –> 00:04:25,040
f قرار می دهیم و سپس در این فضای نام
101
00:04:25,040 –> 00:04:25,919
102
00:04:25,919 –> 00:04:28,479
، فایل را اجرا می کنیم و آن را به
103
00:04:28,479 –> 00:04:30,000
صورت
104
00:04:30,000 –> 00:04:33,440
تکه ای دانلود می کنیم، بنابراین چهار قسمت را انجام می دهیم
105
00:04:33,840 –> 00:04:38,000
و سپس ما از طریق پاسخ
106
00:04:39,440 –> 00:04:44,960
مانند این اجازه دهید تکرار می کنیم از یک اندازه تکه چهار استفاده کنید
107
00:04:48,320 –> 00:04:51,280
و سپس ما فقط میخواهیم فایل 2 بعدی را
108
00:04:51,280 –> 00:04:52,639
مانند آن بنویسیم
109
00:04:52,639 –> 00:04:56,160
تا هر دوی آنها را بارگیری کنیم، فقط
110
00:04:56,160 –> 00:04:56,880
111
00:04:56,880 –> 00:04:59,120
دونقطه را آنجا اضافه میکنیم تا هر دو فایل را دانلود
112
00:04:59,120 –> 00:05:01,280
113
00:05:01,280 –> 00:05:03,280
کنیم، اکنون باید بتوانیم آنها را
114
00:05:03,280 –> 00:05:04,880
در اینجا ببینیم، بنابراین در اینجا ما
115
00:05:04,880 –> 00:05:07,360
دادههایی داریم. اساساً موضوعات مختلف زیادی دارند،
116
00:05:07,360 –> 00:05:09,120
بنابراین اولین مورد
117
00:05:09,120 –> 00:05:10,080
بیانسه است
118
00:05:10,080 –> 00:05:12,639
و سپس در اینجا خواهیم دید که اگر
119
00:05:12,639 –> 00:05:15,280
به اینجا
120
00:05:15,280 –> 00:05:18,960
بیاییم یک زمینه می گیریم، اما در کنار این
121
00:05:18,960 –> 00:05:20,639
زمینه، qas نیز داریم
122
00:05:20,639 –> 00:05:23,759
که سؤال است
123
00:05:23,759 –> 00:05:26,639
و هر یک از اینها حاوی یک
124
00:05:26,639 –> 00:05:27,440
سؤال است.
125
00:05:27,440 –> 00:05:31,759
و جفت پاسخ، بنابراین ما این سوال را داریم
126
00:05:31,759 –> 00:05:34,000
که بیانسه از چه زمانی شروع به محبوب شدن کرد،
127
00:05:34,000 –> 00:05:36,560
بنابراین این پاسخ در واقع در این
128
00:05:36,560 –> 00:05:37,600
زمینه است و
129
00:05:37,600 –> 00:05:39,520
کاری که ما می خواهیم مدل ما انجام دهد این است
130
00:05:39,520 –> 00:05:42,240
که با
131
00:05:42,240 –> 00:05:45,360
گفتن نشانه شروع و
132
00:05:45,360 –> 00:05:48,639
پایان پاسخ در آن، پاسخ را از آن زمینه استخراج کنیم. پس زمینه
133
00:05:48,639 –> 00:05:52,320
صفر میشویم و در دهه 1990 تاخیر داریم و ما
134
00:05:52,320 –> 00:05:54,039
پاسخ شروع
135
00:05:54,039 –> 00:05:57,039
269 را داریم، به این معنی که یک
136
00:05:57,039 –> 00:06:00,560
کاراکتر 269 را
137
00:06:00,560 –> 00:06:04,479
دریافت میکنیم.
138
00:06:04,479 –> 00:06:07,360
139
00:06:07,360 –> 00:06:08,479
140
00:06:08,479 –> 00:06:10,560
ng برای
141
00:06:10,560 –> 00:06:13,039
اینکه مدل ما واقعاً استخراج شود،
142
00:06:13,039 –> 00:06:16,000
اما یک نقطه شروع و همچنین
143
00:06:16,000 –> 00:06:17,360
نقطه پایانی وجود خواهد داشت که
144
00:06:17,360 –> 00:06:19,039
در اینجا گنجانده نشده است، اما ما آن را
145
00:06:19,039 –> 00:06:20,240
146
00:06:20,240 –> 00:06:23,840
بهزودی به صورت دستی اضافه میکنیم تا
147
00:06:23,840 –> 00:06:25,759
دادههای ما باشد و سپس روی توسعهدهنده نیز آزمایش خواهیم
148
00:06:25,759 –> 00:06:26,960
کرد.
149
00:06:26,960 –> 00:06:30,000
داده ها نیز
150
00:06:30,000 –> 00:06:35,840
دقیقاً مشابه هستند،
151
00:06:39,199 –> 00:06:43,520
بنابراین به سراغ آماده سازی داده ها بروید،
152
00:06:43,520 –> 00:06:46,240
بنابراین اکنون ما فایل های خود را در اینجا داریم
153
00:06:46,240 –> 00:06:47,600
که می
154
00:06:47,600 –> 00:06:49,599
خواهیم آنها را بخوانیم، بنابراین از
155
00:06:49,599 –> 00:06:52,000
کتابخانه json برای آن استفاده می کنیم
156
00:06:52,000 –> 00:06:54,960
و همانطور که قبلا دیدیم. ساختار کاملاً
157
00:06:54,960 –> 00:06:57,440
پیچیده ای در این
158
00:06:57,440 –> 00:06:59,759
json ها وجود دارد، لایه های مختلف زیادی وجود دارد،
159
00:06:59,759 –> 00:07:01,039
بنابراین ما باید
160
00:07:01,039 –> 00:07:03,360
از چند حلقه برای پر کردن هر یک
161
00:07:03,360 –> 00:07:04,880
از اینها استفاده کنیم و آنچه را که می خواهیم استخراج کنیم
162
00:07:04,880 –> 00:07:08,240
که
163
00:07:08,240 –> 00:07:11,280
سؤالات و پاسخ های متنی است که همه
164
00:07:11,280 –> 00:07:12,319
با یکدیگر مطابقت دارند، بنابراین
165
00:07:12,319 –> 00:07:13,680
در پایان ما لیستی از
166
00:07:13,680 –> 00:07:15,360
رشته ها خواهیم داشت که
167
00:07:15,360 –> 00:07:17,280
همه اینها هستند و در مورد
168
00:07:17,280 –> 00:07:19,039
پاسخ ها نیز
169
00:07:19,039 –> 00:07:20,720
موقعیت شروع را خواهیم داشت، بنابراین فهرستی
170
00:07:20,720 –> 00:07:24,400
از فرهنگ لغت خواهد بود که یک مقدار یک
171
00:07:24,400 –> 00:07:25,680
متن و یک مقدار
172
00:07:25,680 –> 00:07:28,800
آن است. موقعیت شروع
173
00:07:28,800 –> 00:07:31,919
بنابراین برای انجام این کار ما هستیم ما یک
174
00:07:31,919 –> 00:07:35,199
تابع به نام ریbbed squad
175
00:07:38,080 –> 00:07:41,599
تعریف می کنیم و ما مسیر خود را در اینجا نیز تعریف می کنیم
176
00:07:41,599 –> 00:07:43,520
و اولین کاری که باید انجام دهیم این است که
177
00:07:43,520 –> 00:07:45,120
در واقع
178
00:07:45,120 –> 00:07:48,720
فایل json را باز کنیم بنابراین با مسیر باز انجام می دهیم
179
00:07:48,720 –> 00:07:52,560
و دوباره
180
00:07:52,560 –> 00:07:54,000
از یک فایل باینری استفاده می کنیم.
181
00:07:54,000 –> 00:07:56,160
b را به عنوان پرچم داشته باشیم،
182
00:07:56,160 –> 00:07:58,240
اما به جای نوشتن، ما در حال خواندن هستیم، بنابراین
183
00:07:58,240 –> 00:08:01,759
از r در اینجا استفاده کنید، بنابراین rb
184
00:08:10,400 –> 00:08:13,759
اجازه دهید من فقط json را در اینجا بارگذاری کنم، بنابراین
185
00:08:13,759 –> 00:08:17,039
اکنون فرهنگ لغت خود را در این
186
00:08:17,039 –> 00:08:20,560
تیم دیکت در اینجا داریم، بنابراین
187
00:08:20,560 –> 00:08:21,919
شاید در حالی که فقط در حال ساخت این
188
00:08:21,919 –> 00:08:24,319
تابع هستیم احتمالاً
189
00:08:24,319 –> 00:08:25,759
انجام آن در اینجا مفیدتر است تا بتوانیم ببینیم واقعاً چه
190
00:08:25,759 –> 00:08:30,400
کاری انجام میدهیم، پس بیایید آن را کپی کنیم
191
00:08:33,360 –> 00:08:40,640
و سپس آن را پر
192
00:08:40,640 –> 00:08:43,760
میکنیم، البته در واقع
193
00:08:43,760 –> 00:08:45,760
باید مسیر
194
00:08:45,760 –> 00:08:55,839
را وارد کنیم، بنابراین بیایید این را انتخاب کنیم
195
00:08:56,240 –> 00:08:59,839
و اکنون میتوانیم ببینید چه چیزی در اینجا وجود دارد،
196
00:09:04,160 –> 00:09:08,080
شاید بتوانیم فقط چند مورد را
197
00:09:08,080 –> 00:09:11,279
به جای همه آنها بارگذاری کنیم
198
00:09:12,560 –> 00:09:16,480
یا می توانیم آن را به این شکل بررسی کنیم،
199
00:09:16,480 –> 00:09:19,760
بنابراین نسخه و
200
00:09:19,760 –> 00:09:23,120
داده هایی را داشته باشیم که در واقع می توانیم
201
00:09:23,120 –> 00:09:25,200
نسخه و داده ها را اینجا ببینیم، بنابراین می خواهیم به
202
00:09:25,200 –> 00:09:26,160
داده ها
203
00:09:26,160 –> 00:09:29,360
و در داخل دسترسی داشته باشیم. داده ها این است که ما لیستی از
204
00:09:29,360 –> 00:09:30,480
همه این موارد مختلف داریم
205
00:09:30,480 –> 00:09:33,120
مواردی که قبلاً سعی می کردم انجام دهم،
206
00:09:33,120 –> 00:09:33,680
بنابراین
207
00:09:33,680 –> 00:09:37,839
ما وارد داده ها می شویم
208
00:09:40,240 –> 00:09:43,279
و فقط چند مورد از آنها را
209
00:09:43,279 –> 00:09:46,320
می گیریم و سپس بخش های مختلف خود را
210
00:09:46,320 –> 00:09:47,600
211
00:09:47,600 –> 00:09:50,880
برای اولین مورد دریافت می کنیم، اجازه دهید فقط
212
00:09:50,880 –> 00:09:54,000
صفر را که بیانسه است
213
00:09:54,000 –> 00:09:56,880
و سپس همه این ها را داریم. میخواهیم
214
00:09:56,880 –> 00:09:58,320
215
00:09:58,320 –> 00:10:01,040
از طریق هر یک از اینها حلقه
216
00:10:01,040 –> 00:10:02,079
بزنیم، زیرا ما
217
00:10:02,079 –> 00:10:05,680
این یکی را داریم و
218
00:10:05,680 –> 00:10:10,399
به انجام همه اینها
219
00:10:10,480 –> 00:10:13,920
ادامه میدهیم، بنابراین بیایید کاری را که
220
00:10:13,920 –> 00:10:18,320
میخواهیم برای گروه در تیم انجام دهیم، انجام
221
00:10:18,320 –> 00:10:21,360
دهیم و به یاد داشته باشیم که به آن نیاز داریم. برای
222
00:10:21,360 –> 00:10:22,720
گنجاندن
223
00:10:22,720 –> 00:10:26,240
دادهها در اینجا،
224
00:10:26,240 –> 00:10:30,480
اجازه دهید ببینیم چگونه عنوان گروه
225
00:10:30,480 –> 00:10:33,519
را میگوییم تا بتوانیم تعدادی از آنها را ببینیم، بسیار
226
00:10:33,519 –> 00:10:35,920
خوب، من هر یک از
227
00:10:35,920 –> 00:10:38,079
آنها را مرور
228
00:10:38,079 –> 00:10:42,079
229
00:10:42,079 –> 00:10:44,160
230
00:10:44,160 –> 00:10:45,440
میکنم، بنابراین بخش دوم آن این پاراگرافها هستند و در داخل پاراگرافها
231
00:10:45,440 –> 00:10:49,040
هر کدام را داریم. از سؤالات ما،
232
00:10:49,040 –> 00:10:52,160
بنابراین اجازه دهید
233
00:10:52,240 –> 00:10:55,839
ابتدا پاراگرافها را بررسی کنیم و اینجا را بررسی میکنیم،
234
00:10:55,839 –> 00:11:01,839
235
00:11:04,079 –> 00:11:07,839
متأسفیم فهرستی است که میرویم
236
00:11:08,399 –> 00:11:10,959
و اولین چیزی که باید استخراج کنیم
237
00:11:10,959 –> 00:11:11,760
،
238
00:11:11,760 –> 00:11:15,839
سادهترین مورد است که زمینه ما است،
239
00:11:17,600 –> 00:11:21,600
اما
240
00:11:21,600 –> 00:11:24,720
در یک فهرست نیز قرار دارد، بنابراین اکنون اگر به متن دسترسی داشته
241
00:11:24,720 –> 00:11:28,000
باشیم، این را دریافت
242
00:11:28,000 –> 00:11:31,680
می کنیم اساساً باید
243
00:11:31,680 –> 00:11:34,640
از هر یک از اینها عبور کنیم یا در اینجا حلقه
244
00:11:34,640 –> 00:11:35,920
245
00:11:35,920 –> 00:11:36,959
بزنیم، سپس باید به پاراگراف ها دسترسی داشته باشیم
246
00:11:36,959 –> 00:11:39,200
و از طریق هر یک از آنها حلقه
247
00:11:39,200 –> 00:11:39,839
248
00:11:39,839 –> 00:11:42,320
بزنیم و سپس در اینجا به زمینه دسترسی خواهیم داشت،
249
00:11:42,320 –> 00:11:44,160
250
00:11:44,160 –> 00:11:48,560
بنابراین اجازه دهید آن را بنویسیم تا ما در حال حاضر
251
00:11:48,560 –> 00:11:50,320
یک گروه در اینجا داریم، پس بیایید فقط به آن بچسبیم
252
00:11:50,320 –> 00:11:52,560
253
00:11:52,560 –> 00:11:54,839
و میخواهیم از
254
00:11:54,839 –> 00:11:56,639
255
00:11:56,639 –> 00:11:59,760
قسمت پاراگرافها عبور کنیم،
256
00:11:59,760 –> 00:12:02,720
بنابراین در اینجا ما از
257
00:12:02,720 –> 00:12:03,839
حلقه for در این
258
00:12:03,839 –> 00:12:06,880
شاخص عبور میکنیم و اکنون از یک حلقه در این فهرست عبور میکنیم.
259
00:12:06,880 –> 00:12:07,680
260
00:12:07,680 –> 00:12:11,839
این شاخص
261
00:12:15,040 –> 00:12:19,040
اجازه دهید آن را حفظ کنیم،
262
00:12:19,040 –> 00:12:21,600
به این معنی که ما میتوانیم متن قسمت
263
00:12:21,600 –> 00:12:22,839
را چاپ کنیم
264
00:12:22,839 –> 00:12:25,839
265
00:12:25,839 –> 00:12:28,480
266
00:12:28,959 –> 00:12:31,040
و به آنجا میرویم، بنابراین اینجا
267
00:12:31,040 –> 00:12:32,320
همه مخاطبین خود را داریم، بنابراین این
268
00:12:32,320 –> 00:12:35,200
یکی از سه مورد ما است که باید
269
00:12:35,200 –> 00:12:36,800
استخراج کنیم،
270
00:12:36,800 –> 00:12:39,120
بنابراین عالی است.
271
00:12:39,120 –> 00:12:40,399
با هم
272
00:12:40,399 –> 00:12:45,279
این را می گیریم و آن را اینجا می
273
00:12:45,279 –> 00:12:52,959
گذاریم و سپس زمینه خود را داریم
274
00:12:52,959 –> 00:12:55,680
، بسیار خوب است، اما بدیهی است که برای هر
275
00:12:55,680 –> 00:12:57,120
زمینه، چند
276
00:12:57,120 –> 00:12:58,800
سؤال و پاسخ متفاوت
277
00:12:58,800 –> 00:13:01,920
داریم، بنابراین باید آن ها را هم
278
00:13:01,920 –> 00:13:04,720
اکنون دریافت کنیم که ما را ملزم می کند از یک زمینه
279
00:13:04,720 –> 00:13:06,000
دیگر عبور کنیم. برای حلقه
280
00:13:06,000 –> 00:13:09,279
پس بیایید به این قسمت برویم، باید
281
00:13:09,279 –> 00:13:10,880
به کلید qas برویم
282
00:13:10,880 –> 00:13:14,320
و از طریق این لیست
283
00:13:14,320 –> 00:13:17,680
پرسش و پاسخ حلقه
284
00:13:18,839 –> 00:13:20,959
بزنیم، بنابراین این
285
00:13:20,959 –> 00:13:23,920
را داریم و سپس لیست خود را داریم، بنابراین یک لایه دیگر
286
00:13:23,920 –> 00:13:24,880
287
00:13:24,880 –> 00:13:28,079
در حلقه for ما برای
288
00:13:28,079 –> 00:13:29,839
پاسخ به سؤال
289
00:13:29,839 –> 00:13:34,480
در قسمت qas خواهد بود
290
00:13:34,480 –> 00:13:36,639
و سپس بیایید نگاهی به آنچه
291
00:13:36,639 –> 00:13:37,839
در آنجا داریم
292
00:13:37,839 –> 00:13:41,440
بیاندازیم، بسیار عالی، بنابراین ما پاسخ های قابل قبولی برای
293
00:13:41,440 –> 00:13:44,800
پرسش و پاسخ داریم،
294
00:13:44,800 –> 00:13:48,639
بنابراین آنچه ما در اینجا می خواهیم سؤال
295
00:13:48,639 –> 00:13:54,079
و پاسخ است، بنابراین سؤال اولین سؤال ما است،
296
00:13:55,839 –> 00:14:03,839
بنابراین اکنون سؤالات را
297
00:14:15,760 –> 00:14:18,240
داریم و پس از استخراج سؤالات
298
00:14:18,240 –> 00:14:21,519
سوالی که میتوانیم به پاسخهایمان
299
00:14:21,519 –> 00:14:24,399
برویم، همانطور که در اینجا میبینیم پاسخها بهعنوان
300
00:14:24,399 –> 00:14:25,680
یک لیست دیگر میآیند،
301
00:14:25,680 –> 00:14:27,680
حالا هر یک از این لیستها
302
00:14:27,680 –> 00:14:30,560
فقط یک پاسخ واقعی در آنجا دارند
303
00:14:30,560 –> 00:14:32,000
که کاملاً خوب است، بنابراین ما میتوانیم از
304
00:14:32,000 –> 00:14:34,560
دو طریق به آن دسترسی داشته باشیم که میتوانیم
305
00:14:34,560 –> 00:14:38,560
از طریق آن حلقه بزنیم. یا میتوانیم به مقدار صفر
306
00:14:38,560 –> 00:14:39,600
آن
307
00:14:39,600 –> 00:14:44,560
آرایه در هر دو صورت دسترسی داشته باشیم، مهم نیست،
308
00:14:44,560 –> 00:14:47,600
بنابراین تنها کاری که باید در اینجا انجام دهیم این
309
00:14:47,600 –> 00:14:50,480
است که از طریق آن پاسخها حلقه بزنیم یا اگر میخواهیم
310
00:14:50,480 –> 00:14:51,360
311
00:14:51,360 –> 00:14:56,399
فقط با پاسخهای qa پیش برویم،
312
00:14:56,839 –> 00:14:59,839
313
00:15:01,920 –> 00:15:04,720
بنابراین در اکثر موارد این باید
314
00:15:04,720 –> 00:15:07,440
کاملاً خوب باشد.
315
00:15:07,519 –> 00:15:10,480
همانطور که میتوانیم در اینجا بیشتر این سؤالات را ببینیم
316
00:15:10,480 –> 00:15:12,000
و سپس آنها
317
00:15:12,000 –> 00:15:16,959
فرهنگ لغت پاسخهایی دارند که خوب است،
318
00:15:16,959 –> 00:15:20,160
اما برخی از آنها کمی
319
00:15:20,160 –> 00:15:22,560
متفاوت هستند،
320
00:15:23,199 –> 00:15:25,519
بنابراین اگر به سمت پایین تا انتها حرکت
321
00:15:25,519 –> 00:15:27,839
کنیم،
322
00:15:28,800 –> 00:15:31,519
ببینید خوب است، ما این را داریم که در مورد فیزیک صحبت
323
00:15:31,519 –> 00:15:32,079
میکند
324
00:15:32,079 –> 00:15:34,560
325
00:15:36,160 –> 00:15:38,720
و سپس به جای با
326
00:15:38,720 –> 00:15:39,600
داشتن آرایه پاسخهایمان، این
327
00:15:39,600 –> 00:15:42,959
پاسخهای معقول را داریم که
328
00:15:42,959 –> 00:15:45,920
مشخصاً کمی متفاوت است و
329
00:15:45,920 –> 00:15:46,880
این مورد
330
00:15:46,880 –> 00:15:50,160
برای چند نفر از آنها است، بنابراین با توجه به
331
00:15:50,160 –> 00:15:51,519
آنچه که من دیدم،
332
00:15:51,519 –> 00:15:53,519
بهترین راه برای مقابله با آن این
333
00:15:53,519 –> 00:15:57,519
است که به سادگی بررسی کنیم که آیا وجود دارد یا خیر.
334
00:15:57,519 –> 00:15:59,839
یک کلید پاسخهای قابل قبول در
335
00:15:59,839 –> 00:16:00,959
فرهنگ لغت،
336
00:16:00,959 –> 00:16:03,199
ما آن را بهعنوان پاسخ
337
00:16:03,199 –> 00:16:04,000
به جای
338
00:16:04,000 –> 00:16:07,040
فرهنگ لغت پاسخهای واقعی قرار
339
00:16:07,040 –> 00:16:12,160
میدهیم، بنابراین برای انجام این کار تنها کاری که باید انجام دهیم این
340
00:16:12,160 –> 00:16:15,440
است که بررسی کنیم آیا
341
00:16:15,440 –> 00:16:18,399
کلیدهای qa حاوی پاسخهای قابل قبولی هستند یا نه، اگر از آن
342
00:16:18,399 –> 00:16:20,839
استفاده میکنیم، در غیر این صورت از پاسخها استفاده
343
00:16:20,839 –> 00:16:23,839
344
00:16:34,839 –> 00:16:37,839
345
00:16:38,320 –> 00:16:41,199
میکنیم. از این یکی استفاده کنید
346
00:16:41,360 –> 00:16:44,000
در غیر این صورت
347
00:16:47,360 –> 00:16:51,839
از پاسخها استفاده خواهیم کرد،
348
00:16:51,839 –> 00:16:54,959
پس بیایید همه آنها را
349
00:16:54,959 –> 00:16:59,360
در اینجا به حلقه for خود اضافه کنیم تا زمینه خود را داشته باشیم
350
00:16:59,360 –> 00:17:01,440
و سپس میخواهیم پاسخهای سؤال را حلقه بزنیم
351
00:17:01,440 –> 00:17:05,839
352
00:17:11,119 –> 00:17:19,199
و اینجاست که ما سوال خود را دریافت کنید،
353
00:17:19,199 –> 00:17:22,240
اما پس از رسیدن به اینجا، باید کاری متفاوت انجام
354
00:17:22,240 –> 00:17:23,280
دهیم
355
00:17:23,280 –> 00:17:26,400
که کمتر
356
00:17:26,400 –> 00:17:28,959
قابل قبول است،
357
00:17:30,840 –> 00:17:33,520
خوب است و سپس از این
358
00:17:33,520 –> 00:17:34,400
متغیر دسترسی استفاده
359
00:17:34,400 –> 00:17:37,120
می کنیم تا مشخص کنیم چه چیزی را در
360
00:17:37,120 –> 00:17:39,919
مرحله بعدی قرار خواهیم داد،
361
00:17:41,039 –> 00:17:44,720
بنابراین در اینجا به چهار پاسخ پاسخ می دهیم.
362
00:17:44,720 –> 00:17:48,799
با عرض پوزش در دسترسی qa،
363
00:17:48,799 –> 00:17:50,559
زیرا این به
364
00:17:50,559 –> 00:17:53,840
پاسخها یا پاسخهای قابل استفاده تغییر میکند
365
00:17:54,080 –> 00:17:57,440
و سپس در این حلقه for، اینجاست
366
00:17:57,440 –> 00:17:58,400
که
367
00:17:58,400 –> 00:18:01,520
میتوانیم این پرسش
368
00:18:01,520 –> 00:18:04,880
و پاسخ متنی را به فهرستی
369
00:18:04,880 –> 00:18:07,919
از پرسشها و پاسخهایی
370
00:18:07,919 –> 00:18:11,440
که باید در اینجا تعریف کنیم، اضافه کنیم.
371
00:18:11,840 –> 00:18:14,000
از اینها فقط
372
00:18:14,000 –> 00:18:17,200
یک لیست خالی خواهد بود
373
00:18:22,160 –> 00:18:26,320
و سپس تمام کاری که ما انجام می دهیم این را در سراسر آن کپی می
374
00:18:26,480 –> 00:18:29,280
کنیم و فقط همه چیزهایی را که استخراج کرده ایم
375
00:18:29,280 –> 00:18:30,000
376
00:18:30,000 –> 00:18:32,799
در این حلقه
377
00:18:34,799 –> 00:18:37,760
و پرسش و پاسخ زمینه را اضافه
378
00:18:41,360 –> 00:18:43,840
می
379
00:18:45,200 –> 00:18:47,840
380
00:18:50,640 –> 00:18:56,799
کنیم و باید کار کند،
381
00:18:56,799 –> 00:19:00,320
بنابراین اکنون اجازه دهید به چند مورد نگاهی بیندازیم.
382
00:19:00,320 –> 00:19:03,840
در مورد زمینه خوب است و
383
00:19:03,840 –> 00:19:05,760
ببینید که ما این را داریم و چون
384
00:19:05,760 –> 00:19:07,200
برای هر زمینه چندین پاسخ سوال داریم
385
00:19:07,200 –> 00:19:08,240
386
00:19:08,240 –> 00:19:10,480
، زمینه بارها و بارها تکرار می
387
00:19:10,480 –> 00:19:12,799
شود،
388
00:19:14,080 –> 00:19:15,679
اما پس از آن باید چیزی
389
00:19:15,679 –> 00:19:17,120
کمی متفاوت ببینیم.
390
00:19:17,120 –> 00:19:22,400
پاسخ ها و
391
00:19:22,840 –> 00:19:24,880
سؤالات بسیار
392
00:19:24,880 –> 00:19:27,760
خوب است، ما اکنون داده های خود را در قالب قابل استفاده مجدد
393
00:19:27,760 –> 00:19:29,200
394
00:19:29,200 –> 00:19:31,280
داریم، اما می خواهیم این کار را هم برای مجموعه آموزشی و هم برای
395
00:19:31,280 –> 00:19:32,400
396
00:19:32,400 –> 00:19:35,760
مجموعه اعتبار سنجی انجام دهیم، بنابراین
397
00:19:35,760 –> 00:19:38,160
کاری که می خواهیم انجام دهیم این است
398
00:19:38,160 –> 00:19:39,440
که این را در
399
00:19:39,440 –> 00:19:44,240
تابعی قرار دهیم که قبلاً بودیم. این کار را انجام می دهیم که قبل از
400
00:19:45,600 –> 00:19:53,840
کدام این گروه خوانده شده است،
401
00:19:54,000 –> 00:19:56,240
بنابراین در اینجا ما می خواهیم داده های خود را بخوانیم
402
00:19:56,240 –> 00:19:58,080
و سپس آنها را بررسی کرده
403
00:19:58,080 –> 00:20:00,720
و آن را به سه لیست خود تبدیل می کنیم،
404
00:20:00,720 –> 00:20:01,840
اکنون باید انجام دهیم این
405
00:20:01,840 –> 00:20:07,840
است که در واقع آن سه لیست
406
00:20:12,400 –> 00:20:15,760
و پاسخ را برگردانیم، بنابراین اکنون چه ما میتوانیم
407
00:20:15,760 –> 00:20:17,600
این تابع را
408
00:20:17,600 –> 00:20:20,080
برای مجموعههای آموزشی و اعتبارسنجی خود اجرا
409
00:20:20,080 –> 00:20:22,400
410
00:20:22,559 –> 00:20:26,799
کنیم، بنابراین سؤالات و پاسخهای مخاطبین را آموزش میدهیم،
411
00:20:26,799 –> 00:20:35,840
412
00:20:50,480 –> 00:20:52,240
بنابراین این یکی از آنهاست و ما فقط میتوانیم آن را
413
00:20:52,240 –> 00:20:53,520
کپی
414
00:20:53,520 –> 00:20:55,840
کنیم
415
00:20:58,159 –> 00:21:00,240
و فقط میخواهیم این
416
00:21:00,240 –> 00:21:03,840
مجموعه تأیید اعتبار
417
00:21:13,600 –> 00:21:17,840
ما باشد.
418
00:21:18,480 –> 00:21:21,440
بنابراین بسیار خوب است که ما اکنون
419
00:21:21,440 –> 00:21:22,960
زمینه آموزشی و
420
00:21:22,960 –> 00:21:27,760
زمینه نقض را داریم که میتوانیم اینجا ببینیم،
421
00:21:27,760 –> 00:21:31,200
422
00:21:31,200 –> 00:21:34,000
بنابراین در اینجا امیدواریم که
423
00:21:34,000 –> 00:21:35,600
تفاوت جزئی
424
00:21:35,600 –> 00:21:44,880
در آنچه میبینیم بین هر دو وجود داشته
425
00:21:44,880 –> 00:21:48,799
باشد بسیار عالی است، چیزی که ما انتظار داریم
426
00:21:48,799 –> 00:21:52,000
خوب باشد، بنابراین اکنون دادههای خود را در اختیار داریم.
427
00:21:52,000 –> 00:21:54,480
ost با فرمت مناسب ما فقط باید
428
00:21:54,480 –> 00:21:55,200
429
00:21:55,200 –> 00:21:58,640
موقعیت پایان را اضافه
430
00:21:58,640 –> 00:22:00,320
کنیم تا از قبل موقعیت شروع
431
00:22:00,320 –> 00:22:02,080
را داشته باشیم.
432
00:22:02,080 –> 00:22:06,320
433
00:22:06,320 –> 00:22:07,600
434
00:22:07,600 –> 00:22:10,880
435
00:22:10,880 –> 00:22:14,080
436
00:22:14,080 –> 00:22:16,400
ما باید در اینجا این کار را انجام دهیم این است که در واقع
437
00:22:16,400 –> 00:22:18,240
تابعی را تعریف کنیم که
438
00:22:18,240 –> 00:22:21,520
از طریق هر یک از پاسخ ها
439
00:22:21,520 –> 00:22:24,640
و زمینه های ما بگذرد و بفهمد که آن
440
00:22:24,640 –> 00:22:27,919
کاراکتر پایانی واقعاً کجاست و
441
00:22:27,919 –> 00:22:28,480
البته
442
00:22:28,480 –> 00:22:30,960
ما فقط می توانیم بگوییم خوب
443
00:22:30,960 –> 00:22:32,080
طول متنی است
444
00:22:32,080 –> 00:22:34,240
که آن را به آن اضافه می کنیم. پاسخ دهید و
445
00:22:34,240 –> 00:22:36,400
ما پایان پاسخ خود را داریم،
446
00:22:36,400 –> 00:22:40,080
اما متأسفانه جواب نمی دهد
447
00:22:40,080 –> 00:22:40,640
زیرا
448
00:22:40,640 –> 00:22:43,280
برخی از پاسخ ها در واقع نادرست
449
00:22:43,280 –> 00:22:44,159
450
00:22:44,159 –> 00:22:46,960
هستند و معمولاً با یک یا دو کاراکتر خاموش می شوند،
451
00:22:46,960 –> 00:22:48,159
452
00:22:48,159 –> 00:22:50,880
بنابراین ما در واقع باید آن را بررسی کنیم و
453
00:22:50,880 –> 00:22:51,919
آن را اصلاح کنیم
454
00:22:51,919 –> 00:22:57,039
و پایان خود را اضافه کنیم.
455
00:22:57,039 –> 00:22:58,880
برای انجام این کار، ما فقط
456
00:22:58,880 –> 00:23:01,679
یک تابع جدید تعریف
457
00:23:02,640 –> 00:23:06,840
می کنیم که اضافه و
458
00:23:06,840 –> 00:23:09,679
نمایه می شود و در اینجا
459
00:23:09,679 –> 00:23:13,919
ما پاسخ ها و زمینه خود
460
00:23:13,919 –> 00:23:15,840
را خواهیم داشت و سپس فقط آنها را وارد می کنیم،
461
00:23:15,840 –> 00:23:17,200
بنابراین
462
00:23:17,200 –> 00:23:19,760
ابتدا حلقه را انجام می دهیم. از طریق هر
463
00:23:19,760 –> 00:23:23,840
جفت پاسخ و زمینه
464
00:23:36,559 –> 00:23:38,240
و سپس چیزی را استخراج می کنیم که
465
00:23:38,240 –> 00:23:39,600
به آن متن طلایی می گویند
466
00:23:39,600 –> 00:23:42,640
که اساساً پاسخی است
467
00:23:42,640 –> 00:23:44,720
که ما به دنبال آن هستیم به نام
468
00:23:44,720 –> 00:23:48,159
متن طلایی یا متن طلایی
469
00:23:48,840 –> 00:23:51,360
470
00:23:51,360 –> 00:23:54,960
به همین سادگی پاسخ ما و در داخل آن
471
00:23:54,960 –> 00:23:59,279
متن بنابراین ما این را بیرون می آوریم. در اینجا،
472
00:23:59,279 –> 00:24:01,760
بنابراین ما باید از قبل شاخص شروع را بشناسیم،
473
00:24:01,760 –> 00:24:02,880
474
00:24:02,880 –> 00:24:06,159
بنابراین کاری که در اینجا انجام خواهیم داد این است که
475
00:24:06,240 –> 00:24:09,360
به سادگی آن را نیز بیرون بکشیم
476
00:24:14,799 –> 00:24:18,400
و سپس ایندکس و در
477
00:24:18,400 –> 00:24:21,840
حالت ایده آل
478
00:24:21,840 –> 00:24:25,039
شروع به اضافه
479
00:24:25,039 –> 00:24:28,640
طول متن طلایی خواهد بود،
480
00:24:29,600 –> 00:24:31,919
اما همیشه اینطور نیست
481
00:24:31,919 –> 00:24:33,679
زیرا همانطور که گفتم قبل از اینکه آنها
482
00:24:33,679 –> 00:24:37,039
بتوانند با یک یا دو کاراکتر خاموش شوند،
483
00:24:37,279 –> 00:24:39,679
بنابراین ما نیاز داریم که منطقی را فقط برای
484
00:24:39,679 –> 00:24:41,520
مقابله با آن اضافه کنیم،
485
00:24:41,520 –> 00:24:44,080
بنابراین در مورد اول ما فرض می کنیم که
486
00:24:44,080 –> 00:24:44,880
487
00:24:44,880 –> 00:24:50,480
کاراکترها خاموش نیستند، بنابراین اگر متن
488
00:24:53,679 –> 00:25:01,840
شروع به پایان
489
00:25:02,000 –> 00:25:05,039
با متن طلایی شود، به
490
00:25:05,039 –> 00:25:08,400
این معنی است که همه چیز درست است. خوب است و
491
00:25:08,400 –> 00:25:10,720
ما نیازی به نگرانی در مورد آن نداریم، بنابراین می توانیم
492
00:25:10,720 –> 00:25:12,000
493
00:25:12,000 –> 00:25:15,520
فرهنگ لغت اصلی را تغییر دهیم و می توانیم
494
00:25:15,520 –> 00:25:18,799
انتهای پاسخ را به آن اضافه
495
00:25:18,799 –> 00:25:22,240
کنیم و آن را با شاخص پایان خود برابر کردیم،
496
00:25:22,240 –> 00:25:24,640
497
00:25:25,440 –> 00:25:27,120
اما اینطور نیست و به این معنی است که
498
00:25:27,120 –> 00:25:29,200
ما یک حرفه ای داریم. blem این یکی از آن
499
00:25:29,200 –> 00:25:34,240
جفتهای پاسخ سوال مبهم است و بنابراین
500
00:25:34,240 –> 00:25:37,279
این بار کاری که میتوانیم انجام دهیم این است
501
00:25:37,279 –> 00:25:40,480
که یک عبارت دیگر اضافه
502
00:25:40,480 –> 00:25:42,720
میکنیم، بنابراین زمانی که
503
00:25:42,720 –> 00:25:44,720
موقعیت با یک یا دو کاراکتر
504
00:25:44,720 –> 00:25:46,720
خاموش میشود، به این نتیجه میرسیم، زیرا با این کار خاموش نیست. بیشتر از
505
00:25:46,720 –> 00:25:47,440
این، در
506
00:25:47,440 –> 00:25:50,400
مجموعه داده های تیم به آن ها
507
00:25:50,720 –> 00:25:53,520
نگاه کنید و ما می گوییم خوب است
508
00:25:53,520 –> 00:25:56,240
اگر زمینه
509
00:25:56,240 –> 00:25:59,279
و سپس در اینجا باید
510
00:25:59,279 –> 00:26:02,000
نمایه اره را اضافه کنیم و این را دوباره اضافه کنیم، بنابراین بیایید
511
00:26:02,000 –> 00:26:02,720
512
00:26:02,720 –> 00:26:06,559
آن را راحت تر کپی و جایگذاری کنیم، اما این بار
513
00:26:06,559 –> 00:26:08,400
بررسی کنید که آیا
514
00:26:08,400 –> 00:26:10,960
با یک یا دو کاراکتر خاموش است، بنابراین فقط
515
00:26:10,960 –> 00:26:11,440
منهای
516
00:26:11,440 –> 00:26:13,760
n را انجام دهید و همیشه منهای است و آیا
517
00:26:13,760 –> 00:26:15,120
518
00:26:15,120 –> 00:26:17,039
تغییر نمی کند همیشه به
519
00:26:17,039 –> 00:26:18,640
جای جابجایی به راست به چپ منتقل می شود،
520
00:26:18,640 –> 00:26:22,240
بنابراین این خوب است،
521
00:26:22,640 –> 00:26:26,640
بنابراین در این مورد خوب است در صورتی که پاسخ با
522
00:26:26,640 –> 00:26:30,799
n نشانه خاموش است و بنابراین ما باید
523
00:26:30,799 –> 00:26:33,919
مقدار شروع پاسخ خود را به روز کنیم و همچنین
524
00:26:33,919 –> 00:26:39,840
مقدار پایان پاسخ خود را اضافه کنیم،
525
00:26:45,919 –> 00:26:50,000
بنابراین شاخص شروع منهای n و ما
526
00:26:50,000 –> 00:26:53,840
نیز پایان را داشته باشیم،
527
00:27:02,559 –> 00:27:05,200
بنابراین عالی است که می توانیم آن را بگیریم و
528
00:27:05,200 –> 00:27:06,559
می توانیم آن را در مورد خود اعمال
529
00:27:06,559 –> 00:27:10,240
کنیم. مجموعههای قطار و اعتبارسنجی،
530
00:27:10,240 –> 00:27:15,679
بنابراین تنها کاری که ما در اینجا انجام میدهیم این است که تابع را فراخوانی
531
00:27:16,960 –> 00:27:20,000
میکنیم و آن را انجام میدهیم فقط پاسخ
532
00:27:20,000 –> 00:27:24,000
های قطار و آموزش مخاطبین را انجام دهید
533
00:27:24,640 –> 00:27:28,960
البته ما فقط می توانیم این را کپی کنیم
534
00:27:29,440 –> 00:27:35,840
و همین کار را برای مجموعه اعتبار سنجی خود انجام دهیم
535
00:27:38,960 –> 00:27:41,679
بسیار عالی است، بنابراین اکنون اگر
536
00:27:41,679 –> 00:27:43,600
نگاهی گذرا داشته
537
00:27:43,600 –> 00:27:49,039
باشیم باید بتوانیم ببینیم
538
00:27:49,039 –> 00:27:53,520
که چند مورد از این نقاط پایانی را نیز داریم.
539
00:27:53,840 –> 00:27:57,679
بنابراین من فکر می کنم که خیلی خوب به نظر می رسد
540
00:27:57,679 –> 00:27:59,919
و این بدان معنی است که ما می توانیم در
541
00:27:59,919 –> 00:28:02,240
واقع متن خود را رمزگذاری کنیم
542
00:28:02,240 –> 00:28:04,559
543
00:28:11,200 –> 00:28:13,919
تا متن خود را رمزگذاری یا رمزگذاری کنیم، اینجاست
544
00:28:13,919 –> 00:28:14,559
که ما
545
00:28:14,559 –> 00:28:18,080
یک توکنایزر وارد
546
00:28:18,080 –> 00:28:19,760
می کنیم، بنابراین باید کتابخانه ترانسفورماتور را
547
00:28:19,760 –> 00:28:22,320
برای این کار وارد کنیم
548
00:28:22,320 –> 00:28:25,360
و از ترانسفورماتورهایی که می خواهیم وارد کنیم.
549
00:28:25,360 –> 00:28:27,520
سیلبرت را وارد کنید تا نقره
550
00:28:27,520 –> 00:28:28,799
یک نسخه کوچکتر از
551
00:28:28,799 –> 00:28:32,480
برت است که کمی سریعتر اجرا
552
00:28:32,480 –> 00:28:32,960
553
00:28:32,960 –> 00:28:36,240
می شود اما زمان زیادی طول می کشد
554
00:28:36,640 –> 00:28:39,039
و ما قصد داریم
555
00:28:39,039 –> 00:28:41,039
نسخه سریع توکنایزر را وارد کنیم زیرا این
556
00:28:41,039 –> 00:28:42,399
به ما امکان می دهد
557
00:28:42,399 –> 00:28:45,520
راحت تر تنظیم کنیم.
558
00:28:45,520 –> 00:28:48,159
کاراکتر ما و سپس مکانها را به
559
00:28:48,159 –> 00:28:49,039
نشانه
560
00:28:49,039 –> 00:28:52,240
شروع میکنیم و بعداً مکانها را شروع
561
00:28:52,240 –> 00:28:54,720
میکنیم، بنابراین ابتدا باید توکنایزر خود را مقداردهی اولیه
562
00:28:54,720 –> 00:28:59,520
کنیم
563
00:28:59,520 –> 00:29:03,440
که بسیار آسان است، تنها کاری که انجام میدهیم این است
564
00:29:03,440 –> 00:29:04,240
که آن را از
565
00:29:04,240 –> 00:29:13,840
یک مدل از پیش آموزش دیده بارگیری کنیم
566
00:29:27,120 –> 00:29:28,960
و سپس تمام کاری که انجام میدهیم انجام میدهیم. برای ایجاد
567
00:29:28,960 –> 00:29:30,880
رمزگذاریهایمان این است
568
00:29:30,880 –> 00:29:33,760
که توکنایزر را فراخوانی کنیم، بنابراین ابتدا مجموعه آموزشی را انجام میدهیم
569
00:29:33,760 –> 00:29:36,640
570
00:29:37,600 –> 00:29:40,960
که توکنایزر نامیده میشود و در اینجا
571
00:29:40,960 –> 00:29:41,679
572
00:29:41,679 –> 00:29:44,559
مخاطبین آموزشی
573
00:29:45,840 –> 00:29:49,679
و سؤالات آموزشی را اضافه میکنیم،
574
00:29:49,679 –> 00:29:55,200
بنابراین کاری که انجام میدهد این
575
00:29:55,200 –> 00:29:58,000
است که در واقع این دو رشته را با هم ادغام کنیم
576
00:29:58,000 –> 00:29:58,880
577
00:29:58,880 –> 00:30:02,159
تا چه کنیم. have
578
00:30:02,159 –> 00:30:04,000
متن ما است و سپس یک
579
00:30:04,000 –> 00:30:05,679
توکن جداکننده
580
00:30:05,679 –> 00:30:07,520
و به دنبال آن سوال وجود خواهد
581
00:30:07,520 –> 00:30:08,960
داشت
582
00:30:08,960 –> 00:30:12,399
و در طول آموزش به نقره وارد می شود،
583
00:30:14,240 –> 00:30:16,720
من فقط می خواهم بالشتک را در آنجا نیز اضافه کنم
584
00:30:16,720 –> 00:30:18,000
و سپس این را کپی می کنیم
585
00:30:18,000 –> 00:30:23,840
و همین کار را برای مجموعه اعتبار سنجی خود انجام می دهیم
586
00:30:37,120 –> 00:30:40,000
بسیار خوب و این داده های ما را
587
00:30:40,000 –> 00:30:40,480
به
588
00:30:40,480 –> 00:30:45,120
اشیاء رمزگذاری تبدیل می کند، بنابراین
589
00:30:45,120 –> 00:30:48,720
کاری که ما می توانیم در اینجا انجام دهیم این است
590
00:30:48,720 –> 00:30:51,200
که قسمت های مختلفی را که
591
00:30:51,200 –> 00:30:51,919
592
00:30:51,919 –> 00:30:55,279
در کدگذاری های خود داریم چاپ کنیم، بنابراین در اینجا
593
00:30:55,279 –> 00:31:01,039
وارد شوید تا شناسه های ورودی داشته باشید، بنابراین اجازه دهید به آن دسترسی داشته باشیم
594
00:31:02,880 –> 00:31:05,919
و در اینجا ما را پیدا کنید. یک
595
00:31:05,919 –> 00:31:09,200
لیست بزرگ از همه نمونههای ما داشته باشید، بنابراین
596
00:31:09,200 –> 00:31:13,440
بررسی کنید که ما 130k داشته باشیم
597
00:31:13,440 –> 00:31:16,480
و بیایید فقط یکی از آنها را باز
598
00:31:16,480 –> 00:31:17,360
کنیم و
599
00:31:17,360 –> 00:31:20,080
این شناسهها را داریم و این همان چیزی است که خرس
600
00:31:20,080 –> 00:31:20,799
601
00:31:20,799 –> 00:31:24,320
اکنون خواهد خواند اگر بخواهیم نگاهی
602
00:31:24,320 –> 00:31:24,960
به این داشته باشیم.
603
00:31:24,960 –> 00:31:27,919
به نوعی زبان خوانا برای انسان
604
00:31:27,919 –> 00:31:29,279
است،
605
00:31:29,279 –> 00:31:32,159
ما می توانیم از توکنایزر استفاده کنیم تا
606
00:31:32,159 –> 00:31:34,640
آن را برای خودمان رمزگشایی کند،
607
00:31:38,559 –> 00:31:41,760
خوب و این چیزی است که ما به آن تغذیه می
608
00:31:41,760 –> 00:31:44,240
کنیم، بنابراین ما چند تا از این نشانه های ویژه داریم،
609
00:31:44,240 –> 00:31:46,320
این فقط به این معنی است که شروع
610
00:31:46,320 –> 00:31:47,760
دنباله است
611
00:31:47,760 –> 00:31:51,679
و در اینجا ما داریم یک فرم فرآیندی
612
00:31:51,679 –> 00:31:55,039
از زمینه اصلی ما
613
00:31:55,039 –> 00:31:57,679
اکنون متوجه خواهید شد که متن
614
00:31:57,679 –> 00:31:59,039
در واقع به اینجا ختم می شود
615
00:31:59,039 –> 00:32:00,320
و همانطور که قبلاً گفتم ما
616
00:32:00,320 –> 00:32:02,240
نشانه جداکننده را داریم
617
00:32:02,240 –> 00:32:05,519
و بعد از آن سؤال واقعی خود را داریم
618
00:32:05,519 –> 00:32:06,880
619
00:32:06,880 –> 00:32:09,840
و این همان چیزی است که به برت وارد می شود
620
00:32:09,840 –> 00:32:10,880
اما بدیهی است
621
00:32:10,880 –> 00:32:14,480
که نشانه نسخه id بنابراین
622
00:32:14,480 –> 00:32:16,799
خوب است که از آنچه در واقع به
623
00:32:16,799 –> 00:32:18,720
آن تغذیه می شود و آنچه ما در
624
00:32:18,720 –> 00:32:21,440
اینجا واقعاً استفاده می کنیم آگاه باشید، اما این قالبی
625
00:32:21,440 –> 00:32:23,440
است که انتظار می رود و سپس پس از آن، ما
626
00:32:23,440 –> 00:32:25,200
توکن جداگانه دیگری داریم که به دنبال آن همه
627
00:32:25,200 –> 00:32:26,559
توکن های padding ما قرار می گیرند
628
00:32:26,559 –> 00:32:29,600
زیرا bert انتظار می رود
629
00:32:29,600 –> 00:32:33,279
630
00:32:33,279 –> 00:32:35,440
برای هر نمونه 512 توکن وارد شود، بنابراین ما فقط باید
631
00:32:35,440 –> 00:32:37,279
آن فضا را اساساً پر کنیم
632
00:32:37,279 –> 00:32:40,960
تا این تنها کاری است که انجام می
633
00:32:40,960 –> 00:32:44,559
شود، بیایید آن ها را حذف کنیم و
634
00:32:44,559 –> 00:32:48,159
می توانیم ادامه دهیم تا چیز بعدی که باید
635
00:32:48,159 –> 00:32:49,279
636
00:32:49,279 –> 00:32:52,159
به Enco خود اضافه کنیم
637
00:32:52,799 –> 00:32:55,039
dings موقعیت های شروع و پایان است زیرا
638
00:32:55,039 –> 00:32:56,240
در حال
639
00:32:56,240 –> 00:32:59,440
حاضر آنها را در آنجا نداریم، بنابراین
640
00:32:59,440 –> 00:33:02,480
برای انجام این کار باید
641
00:33:02,480 –> 00:33:05,279
کمی منطق اضافی اضافه کنیم، از این
642
00:33:05,279 –> 00:33:08,080
کاراکتر به روش نشانه استفاده
643
00:33:08,080 –> 00:33:13,039
می کنیم، بنابراین اگر فقط یکی از این ها را برداریم،
644
00:33:15,360 –> 00:33:18,480
بیایید اولین مورد را انتخاب
645
00:33:18,480 –> 00:33:21,279
کنید خوب ما این را داریم
646
00:33:22,240 –> 00:33:26,559
و کاری که میتوانیم انجام دهیم این است که در واقع
647
00:33:26,559 –> 00:33:30,480
این را تغییر دهیم تا از روش نشانه کاراکتر استفاده
648
00:33:30,480 –> 00:33:33,519
کنیم، شناسههای ورودی را حذف میکنیم، زیرا فقط
649
00:33:33,519 –> 00:33:34,480
باید
650
00:33:34,480 –> 00:33:36,880
ایندکس هر کدگذاری را که میخواهیم
651
00:33:36,880 –> 00:33:38,000
652
00:33:38,000 –> 00:33:41,200
تغییر دهیم یا شروع کنیم، به آن منتقل کنیم. موقعیت پایانی
653
00:33:41,200 –> 00:33:42,159
654
00:33:42,159 –> 00:33:45,039
و در اینجا تنها کاری که ما انجام میدهیم این است که
655
00:33:45,039 –> 00:33:46,559
از
656
00:33:46,559 –> 00:33:49,120
کاراکتری که موقعیتی برای آن پیدا کردهایم
657
00:33:49,120 –> 00:33:49,600
658
00:33:49,600 –> 00:33:51,360
به نشانهای که میخواهیم
659
00:33:51,360 –> 00:33:53,519
موقعیتی برای
660
00:33:53,519 –> 00:33:58,320
آن پیدا کنیم و آنچه باید اضافه کنیم پاسخهای قطار
661
00:33:58,320 –> 00:34:01,360
است، ما دوباره موقعیت خود را داریم زیرا
662
00:34:01,360 –> 00:34:02,000
663
00:34:02,000 –> 00:34:04,799
پاسخها و رمزگذاریهای متن
664
00:34:04,799 –> 00:34:06,320
مورد نظر که باید با
665
00:34:06,320 –> 00:34:06,799
666
00:34:06,799 –> 00:34:10,000
پاسخی که میپرسیم مطابقت داشته باشد
667
00:34:10,560 –> 00:34:13,918
و ما پاسخها را شروع
668
00:34:13,918 –> 00:34:15,760
میکنیم، بنابراین در اینجا ما فقط در موقعیت
669
00:34:15,760 –> 00:34:17,679
670
00:34:17,679 –> 00:34:20,960
شخصیت قرار میدهیم و این پاسخ اشکالی
671
00:34:20,960 –> 00:34:23,520
ندارد، بنابراین اگر ما موقعیت نام
672
00:34:23,520 –> 00:34:25,520
کاراکتر و ما انتظار
673
00:34:25,520 –> 00:34:26,639
داریم موقعیت
674
00:34:26,639 –> 00:34:31,599
توکن را که موقعیت 64 است برگردانیم.
675
00:34:31,760 –> 00:34:35,520
بنابراین تنها کاری که اکنون باید انجام دهیم این است که این کار را برای
676
00:34:35,520 –> 00:34:38,000
هر دوی آنها انجام دهیم، بنابراین برای موقعیت شروع
677
00:34:38,000 –> 00:34:40,879
و پایان
678
00:34:44,000 –> 00:34:49,839
اینجا را ببینید ما باید مقدار متفاوتی دریافت کنیم.
679
00:34:50,639 –> 00:34:54,879
اما این یکی از محدودیتهای این است که
680
00:34:54,879 –>