در این مطلب، ویدئو خطوط لوله یادگیری ماشینی End to End برای سازمانهای پایتون – نیک هاروی با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:38:43
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:01,260
قرار است در مورد اینکه چگونه میتوانید خطوط لوله
2
00:00:01,260 –> 00:00:03,510
یادگیری ماشینی را در pachyderm بسازید و نوع آنها را بسازید،
3
00:00:03,510 –> 00:00:06,720
اما نه به
4
00:00:06,720 –> 00:00:08,309
روشی که معمولاً انتظار دارید
5
00:00:08,309 –> 00:00:09,960
درست باشد، چیزی که امروز بیشتر روی آن تمرکز میکنم این
6
00:00:09,960 –> 00:00:13,099
است که شما چگونه خطوط لوله یادگیری ماشین را
7
00:00:13,099 –> 00:00:15,719
به طور کلی میشناسید. شما یک چیز بزرگ را از دست داده اید و
8
00:00:15,719 –> 00:00:18,180
آن این است که شما چیزی به نام
9
00:00:18,180 –> 00:00:19,740
منشأ داده را می شناسید که من تقریباً مطمئن هستم که
10
00:00:19,740 –> 00:00:21,539
بسیاری از شما با آن آشنا هستید، اجازه دهید من
11
00:00:21,539 –> 00:00:26,760
شروع به کار کنم، بنابراین به عنوان دانشمند داده، ما شما را دوست داریم،
12
00:00:26,760 –> 00:00:28,349
بدانید چه کسی درست است، من آنقدرها هم قدیمی نیستم.
13
00:00:28,349 –> 00:00:31,650
بسیار خوب، این دادههای
14
00:00:31,650 –> 00:00:34,140
Star Trek است، اگر میدانید اعتبارنامههای حرفهای من در
15
00:00:34,140 –> 00:00:36,899
آنجا هستند، من فقط از یک
16
00:00:36,899 –> 00:00:38,820
مرجع Star Trek در ارائه خود استفاده کردم،
17
00:00:38,820 –> 00:00:41,510
اما مهمتر از آن، ما به درستی دادههای بزرگ
18
00:00:41,510 –> 00:00:44,370
را دوست داریم و زمانی که
19
00:00:44,370 –> 00:00:46,770
با یادگیری ماشینی درست ترکیب میشوند، آن
20
00:00:46,770 –> 00:00:48,120
را دوست داریم. این گزینههای بسیار قدرتمندی را
21
00:00:48,120 –> 00:00:50,280
ارائه میکند، به خصوص من فقط میخواهم
22
00:00:50,280 –> 00:00:51,300
آن را از میکروفون حذف کنم، زیرا دوست دارم
23
00:00:51,300 –> 00:00:53,309
در اطراف شرکتها حرکت کنم،
24
00:00:53,309 –> 00:00:54,690
آنها به این فکر میکنند که اگر من این
25
00:00:54,690 –> 00:00:56,160
انبوه دادههای بزرگ را که
26
00:00:56,160 –> 00:00:58,109
سرهنگ بودهام بردارم. برای سالها سخنرانی میکنم و من آن را
27
00:00:58,109 –> 00:01:00,210
برای این رشتههای جدید اعمال میکنم یا در این زمینه
28
00:01:00,210 –> 00:01:02,010
جدید به نام خوب نیست استفاده میکنم، اما این زمینه
29
00:01:02,010 –> 00:01:03,149
یادگیری ماشینی به طور ناگهانی
30
00:01:03,149 –> 00:01:05,489
این بینشهای شگفتانگیز را از این
31
00:01:05,489 –> 00:01:07,740
چیزها دریافت میکنم و تازه میخواهم یک دسته از افراد را استخدام کنم.
32
00:01:07,740 –> 00:01:09,750
این افراد دانشمندان داده نامیده میشوند،
33
00:01:09,750 –> 00:01:11,820
من به آنها اجازه میدهم به دادهها دسترسی داشته باشند و
34
00:01:11,820 –> 00:01:13,590
اجازه میدهم درست کار کنند و بگذارند بروند
35
00:01:13,590 –> 00:01:16,409
، بنابراین ما با این موضوع بسیار سروکار داریم،
36
00:01:16,409 –> 00:01:18,360
بنابراین شرکتها
37
00:01:18,360 –> 00:01:19,950
سرمایهگذاری زیادی برای یادگیری ماشین انجام دادهاند.
38
00:01:19,950 –> 00:01:21,390
آنها تعداد زیادی دانشمند داده را استخدام کرده اند
39
00:01:21,390 –> 00:01:22,890
و همه این داده ها را به آنها داده اند و
40
00:01:22,890 –> 00:01:24,960
آنها به نوعی
41
00:01:24,960 –> 00:01:27,420
روی میزهای بزرگ خود نشسته اند و به این فکر می کنند
42
00:01:27,420 –> 00:01:29,280
که من کی آمازون خواهم شد درست است که
43
00:01:29,280 –> 00:01:32,009
این بازیکنان بزرگ بعدی چه خواهم شد. چون
44
00:01:32,009 –> 00:01:33,810
بلافاصله وقتی مردم به داخل پرش
45
00:01:33,810 –> 00:01:35,009
میشوند، سریعاً
46
00:01:35,009 –> 00:01:36,869
به این دو مرحله میروند، من
47
00:01:36,869 –> 00:01:40,380
روی اتصال دادهها به ریاضیات تمرکز میکنم و سپس
48
00:01:40,380 –> 00:01:42,150
انتظار نوعی خروجی را دارم و
49
00:01:42,150 –> 00:01:44,820
سپس آمازون میشوم یا گوگل یا
50
00:01:44,820 –> 00:01:47,430
هوش مصنوعی را باز کنید و بنابراین شروع به کار می کنیم
51
00:01:47,430 –> 00:01:48,509
شاید در مورد استنباط و
52
00:01:48,509 –> 00:01:50,310
پیشبینی فکر کنید، اگر ما واقعاً خیالی میشویم،
53
00:01:50,310 –> 00:01:53,399
اما در واقع، و فکر میکنم شما
54
00:01:53,399 –> 00:01:54,720
بچهها این را از همه بهتر میفهمید
55
00:01:54,720 –> 00:01:56,670
، درست
56
00:01:56,670 –> 00:01:58,500
زمانی که ما شروع به فکر کردن در مورد یک
57
00:01:58,500 –> 00:02:00,659
خط لوله یادگیری ماشینی جامع و کامل
58
00:02:00,659 –> 00:02:02,759
میکنیم، مراحل بیشتری درگیر است. آیا همه مراحل درست نیستند
59
00:02:02,759 –> 00:02:04,610
، هنوز کارهای زیادی باید انجام شود
60
00:02:04,610 –> 00:02:06,450
و هنوز کارهای زیادی وجود دارد که
61
00:02:06,450 –> 00:02:08,459
شما به عنوان یک شرکت ممکن است در مراحل مختلف به طور
62
00:02:08,459 –> 00:02:10,919
متفاوت انجام دهید، اما یکی از بزرگترین
63
00:02:10,919 –> 00:02:13,530
چالش هایی که ما واقعاً می بینیم این
64
00:02:13,530 –> 00:02:15,750
است که یادگیری ماشینی
65
00:02:15,750 –> 00:02:17,040
برای دستیابی به پتانسیل کامل خود،
66
00:02:17,040 –> 00:02:18,420
سه چیز عمده وجود دارد که باید اتفاق بیفتد،
67
00:02:18,420 –> 00:02:21,900
68
00:02:21,900 –> 00:02:23,790
اگر
69
00:02:23,790 –> 00:02:26,640
فکر میکنید 10 15 سال گذشته در
70
00:02:26,640 –> 00:02:29,160
کدهای توسعه نرمافزار
71
00:02:29,160 –> 00:02:31,860
تغییرات زیادی ایجاد کرده است، یکی از دادهها باید همان شیوههای تولید کد را داشته باشد. چگونه
72
00:02:31,860 –> 00:02:34,200
آن را به کار می بریم چگونه از آن استفاده می کنیم نه فقط از
73
00:02:34,200 –> 00:02:35,340
زبان ها و فریم ورک هایی که
74
00:02:35,340 –> 00:02:37,860
ایجاد شده اند، بلکه چگونه از یک
75
00:02:37,860 –> 00:02:39,780
نسخه آن کد به نسخه دیگر به سمت راست حرکت می
76
00:02:39,780 –> 00:02:41,820
کنیم. به طور خاص صحبت کردن در مورد
77
00:02:41,820 –> 00:02:43,770
git به روشی که ما توانایی کنترل نسخه را داریم،
78
00:02:43,770 –> 00:02:45,810
همه چیز را دوباره ادغام کنیم
79
00:02:45,810 –> 00:02:47,370
و آن را بر روی نسخه های بسیار خاص
80
00:02:47,370 –> 00:02:50,010
کد آزمایش کنیم و به شما بفهمانیم که این امکان وجود دارد
81
00:02:50,010 –> 00:02:52,530
که امروز در تولید چه کاری می تواند انجام دهد، اما
82
00:02:52,530 –> 00:02:54,630
داده ها بسیاری از آن ها را به ارث نبرده اند.
83
00:02:54,630 –> 00:02:56,070
اصول ما خیلی
84
00:02:56,070 –> 00:02:57,570
به جلو حرکت کرده ایم سوزن را به سمت جلو برده ایم
85
00:02:57,570 –> 00:02:59,400
اما dienes همیشه به نوعی
86
00:02:59,400 –> 00:03:01,860
در همان چیز ثابت
87
00:03:01,860 –> 00:03:03,420
88
00:03:03,420 –> 00:03:04,830
89
00:03:04,830 –> 00:03:06,660
باقی می ماند.
90
00:03:06,660 –> 00:03:08,970
این منبع بسیار محافظت شده است و
91
00:03:08,970 –> 00:03:11,489
دلیل خوبی دارد، اما ما فقط
92
00:03:11,489 –> 00:03:13,560
آن را به سمت چیزها پرتاب می کنیم و سپس انتظار خروجی داریم،
93
00:03:13,560 –> 00:03:15,600
اما وقتی می خواهیم توضیح دهیم که چه
94
00:03:15,600 –> 00:03:17,720
اتفاقی افتاده است بسیار
95
00:03:17,720 –> 00:03:21,269
96
00:03:21,269 –> 00:03:23,310
دشوار می شود. به درستی محدود نیست،
97
00:03:23,310 –> 00:03:25,590
بنابراین ما باید به دانشمندان و
98
00:03:25,590 –> 00:03:27,269
توسعه دهندگان داده توانایی کار با این
99
00:03:27,269 –> 00:03:29,970
داده ها را بدهیم، اما نه با این
100
00:03:29,970 –> 00:03:32,220
احساس عذاب قریب الوقوع که اگر من چیزی را خراب کنم،
101
00:03:32,220 –> 00:03:34,799
همیشه نابود خواهد شد. آخرین وضعیت شناخته شده
102
00:03:34,799 –> 00:03:36,750
داده ها از بین رفته است و من باید به
103
00:03:36,750 –> 00:03:38,400
کسی ایمیل بزنم تا یک نسخه پشتیبان تهیه کند که
104
00:03:38,400 –> 00:03:39,660
او را ساعت 3:00 صبح از خواب بیدار می کند،
105
00:03:39,660 –> 00:03:41,400
آنها نیاز به توانایی دارند
106
00:03:41,400 –> 00:03:43,980
تا بتوانند
107
00:03:43,980 –> 00:03:46,440
آزادانه آزمایش کنند، اما همچنین به سرعت حرکت
108
00:03:46,440 –> 00:03:47,910
کنید و از زبانها و
109
00:03:47,910 –> 00:03:49,560
چارچوبهای مناسبی که برای آن پروژه کار میکنند استفاده کنید،
110
00:03:49,560 –> 00:03:52,049
نه به این دلیل که همه از آن
111
00:03:52,049 –> 00:03:54,320
زبان برای همیشه استفاده کردهاند
112
00:03:54,320 –> 00:03:57,209
و در نهایت اعتماد به کل سازمان را داشتهاند
113
00:03:57,209 –> 00:03:59,790
و این واقعاً به این نتیجه میرسد که
114
00:03:59,790 –> 00:04:02,700
فکر میکنم این شخصاً
115
00:04:02,700 –> 00:04:03,720
مهمترین چیز من است وقتی به این موضوع فکر میکنم.
116
00:04:03,720 –> 00:04:05,220
امروزه یادگیری ماشینی را در سازمان به
117
00:04:05,220 –> 00:04:06,450
کار میبریم، مخصوصاً اگر وقتی دادههایی داریم
118
00:04:06,450 –> 00:04:08,430
به یادگیری ماشین مسئول
119
00:04:08,430 –> 00:04:12,090
و هوش مصنوعی و علم داده به طور کلی
120
00:04:12,090 –> 00:04:15,480
فکر کنیم و از الگوریتمها برای به
121
00:04:15,480 –> 00:04:17,339
دست آوردن بینش قدرتمند جدید در آن دادهها استفاده
122
00:04:17,339 –> 00:04:19,290
کنیم، باید بتوانیم توضیح دهیم.
123
00:04:19,290 –> 00:04:21,358
آن پیامدها را در هر نقطه مشخص می کنیم و می
124
00:04:21,358 –> 00:04:22,950
توانیم آنها را به وضوح و به سرعت توضیح
125
00:04:22,950 –> 00:04:25,020
دهیم و اگر در مورد آن
126
00:04:25,020 –> 00:04:27,240
و مورد استفاده خاص تر فکر کنیم،
127
00:04:27,240 –> 00:04:30,090
اگر کسی درخواست می کند یک وام بانکی است
128
00:04:30,090 –> 00:04:32,069
و آنها در حال بررسی وب سایت برای
129
00:04:32,069 –> 00:04:33,150
انجام این کار هستند و تمام
130
00:04:33,150 –> 00:04:35,639
اطلاعات خود را درج می کنند، اما در پشت صحنه
131
00:04:35,639 –> 00:04:37,289
بانک پول زیادی را برای
132
00:04:37,289 –> 00:04:40,470
آموزش اینکه چه کسی کاندیدای مناسب برای
133
00:04:40,470 –> 00:04:42,690
وام است و چه چیزی نیست، سرمایه گذاری کرده است. به
134
00:04:42,690 –> 00:04:44,789
نحوه آموزش آن مدل نگاه نکنید، ما به
135
00:04:44,789 –> 00:04:46,410
درستی سوگیری ایجاد می کنیم و من تقریباً مطمئن
136
00:04:46,410 –> 00:04:48,660
هستم که همه شما به خوبی از تعصب هوش مصنوعی و
137
00:04:48,660 –> 00:04:51,720
m/l آگاه هستید، اما مسئله این است که اگر
138
00:04:51,720 –> 00:04:53,849
کسی به خصوص در مورد چیزهایی مانند gdpr بگوید اگر
139
00:04:53,849 –> 00:04:56,130
ما اگر کسی بگوید هی صبر کن
140
00:04:56,130 –> 00:04:58,139
چرا من رد شدم، من جزئیات خاصی
141
00:04:58,139 –> 00:05:00,900
می خواهم که چرا وام من رد شده است اگر
142
00:05:00,900 –> 00:05:02,370
شرکت از یک
143
00:05:02,370 –> 00:05:04,259
مدل یادگیری ماشینی سنگین برای انجام این کار استفاده می کند، توضیح
144
00:05:04,259 –> 00:05:05,729
می دهد که نتیجه بسیار دشوار می شود،
145
00:05:05,729 –> 00:05:08,520
اگر نه گاهی اوقات غیر ممکن، و بنابراین یک
146
00:05:08,520 –> 00:05:12,060
پوسته پوستی است. خوب شما می دانید که من در کجا کار می کنم
147
00:05:12,060 –> 00:05:13,530
تا به جوامع توسعه دهندگان در آنجا کمک کنم تا از
148
00:05:13,530 –> 00:05:14,729
149
00:05:14,729 –> 00:05:16,259
پلتفرم استفاده کنند، اینها
150
00:05:16,259 –> 00:05:17,819
چیزهای بزرگی هستند که می خواهیم حل کنیم و من به
151
00:05:17,819 –> 00:05:19,020
شما بچه ها نشان خواهم داد که چگونه آن را حل می
152
00:05:19,020 –> 00:05:20,520
کنیم و به شما نشان می دهم. پلت فرم ما
153
00:05:20,520 –> 00:05:22,250
کمی اما مو به نوعی
154
00:05:22,250 –> 00:05:25,020
مفهومی را در مورد بهترین عملکرد و نحوه
155
00:05:25,020 –> 00:05:26,909
خط لوله یادگیری ماشینی سرتاسر و
156
00:05:26,909 –> 00:05:28,530
تمام ویژگی هایی که واقعاً
157
00:05:28,530 –> 00:05:32,940
باید برای موفقیت داشته باشد ارائه می دهد، بنابراین
158
00:05:32,940 –> 00:05:34,110
وقتی
159
00:05:34,110 –> 00:05:35,550
به یادگیری ماشین پایان به انتها فکر می کنیم برخی از بزرگترین موانع چیست؟
160
00:05:35,550 –> 00:05:37,710
یا خطوط لوله انتها به انتها
161
00:05:37,710 –> 00:05:39,330
موانع زیادی وجود دارد و اینها فقط
162
00:05:39,330 –> 00:05:41,490
خلاصه ای از برخی از موانع بزرگ هستند.
163
00:05:41,490 –> 00:05:42,960
164
00:05:42,960 –> 00:05:46,770
165
00:05:46,770 –> 00:05:50,000
166
00:05:50,000 –> 00:05:53,639
اگر چیزی را
167
00:05:53,639 –> 00:05:56,250
تغییر دهید، همه چیز را تغییر میدهید، بنابراین پیگیری
168
00:05:56,250 –> 00:05:59,039
همه آن تغییرات ISM
169
00:05:59,039 –> 00:06:00,449
بدون
170
00:06:00,449 –> 00:06:01,949
منشأ یا بدون
171
00:06:01,949 –> 00:06:04,530
نگه داشتن نوعی از اصل و نسب دادهها تقریباً غیرممکن است و اگر
172
00:06:04,530 –> 00:06:05,849
از این موضوع و زمانی که به آن فکر میکنید تصمیم میگیرید.
173
00:06:05,849 –> 00:06:07,650
مدلهای بودن شما میدانید
174
00:06:07,650 –> 00:06:10,590
که تصمیمگیریها بهطور مستقل آموزش دیدهاند
175
00:06:10,590 –> 00:06:12,840
و تاریخچه آن تصمیمها
176
00:06:12,840 –> 00:06:14,699
خیلی سریع و در ابرهای سر و صدا گم میشوند و
177
00:06:14,699 –> 00:06:16,440
البته به
178
00:06:16,440 –> 00:06:18,840
قطارهای لینکلن من از مشتری استفاده میکنم. نوتبوکها من
179
00:06:18,840 –> 00:06:21,120
مستقیماً از پایتون استفاده میکنم، شما بچهها نوبها هستید،
180
00:06:21,120 –> 00:06:23,490
من از C++ استفاده میکنم یا میدانید
181
00:06:23,490 –> 00:06:25,259
که این بحث بزرگ وجود دارد که کدام
182
00:06:25,259 –> 00:06:26,639
زبان بهتر است، من داشتم در مورد
183
00:06:26,639 –> 00:06:28,740
آن صحبت میکردم در ناهار با یکی از دوستانی که میدانید
184
00:06:28,740 –> 00:06:30,960
آیا نوتبوکهای Jupiter ارزش
185
00:06:30,960 –> 00:06:32,490
تولید دارند یا نه و ما فقط به
186
00:06:32,490 –> 00:06:34,199
عقب و جلو می رفتیم و این است که می دانید
187
00:06:34,199 –> 00:06:36,510
طرف کاملاً متضاد
188
00:06:36,510 –> 00:06:38,159
این موضع وجود نداشت، فقط
189
00:06:38,159 –> 00:06:38,780
رویکردهای متفاوتی نسبت به
190
00:06:38,780 –> 00:06:40,910
چیزها داشتیم و اگر
191
00:06:40,910 –> 00:06:42,830
می خواهیم تیم هایی از دانشمندان داده را
192
00:06:42,830 –> 00:06:44,720
با هم داشته باشیم که روی یک موضوع کار کنند. برای حل یک
193
00:06:44,720 –> 00:06:46,580
راه حل منحصربفرد، ما واقعاً باید مطمئن شویم
194
00:06:46,580 –> 00:06:47,900
که آنها توانایی استفاده از ابزارهایی را
195
00:06:47,900 –> 00:06:50,150
دارند که بهترین آنها را می شناسند یا حداقل از
196
00:06:50,150 –> 00:06:51,980
ابزارهایی که برای پروژه مناسب هستند، فقط
197
00:06:51,980 –> 00:06:53,389
به این دلیل که بقیه برنامه های کاربردی
198
00:06:53,389 –> 00:06:55,070
نوشته شده در جاوا به این معنی نیست که ما به آن نیاز داریم. برای
199
00:06:55,070 –> 00:06:57,530
اینکه جاوا را واقعاً به این درست معرفی کنید،
200
00:06:57,530 –> 00:06:58,880
فقط باید زبان یا
201
00:06:58,880 –> 00:07:01,370
چارچوبی باشد که برای مشکل موجود کار می
202
00:07:01,370 –> 00:07:03,350
کند و البته مهمتر از همه،
203
00:07:03,350 –> 00:07:05,780
دوباره به آن ایده منشأ بازگردید.
204
00:07:05,780 –> 00:07:07,490
205
00:07:07,490 –> 00:07:08,960
اگر به آن فکر کنیم، ما
206
00:07:08,960 –> 00:07:12,320
دانشمند داده هستیم، ما دانشمند هستیم، بیشتر موارد
207
00:07:12,320 –> 00:07:13,910
یادگیری ماشینی و هوش مصنوعی که
208
00:07:13,910 –> 00:07:15,169
امروز اتفاق میافتد، هنوز وجود
209
00:07:15,169 –> 00:07:17,450
210
00:07:17,450 –> 00:07:19,970
211
00:07:19,970 –> 00:07:22,250
212
00:07:22,250 –> 00:07:23,480
ندارد. فهرستی از تمام
213
00:07:23,480 –> 00:07:25,160
مقالات یادگیری ماشینی که کد اضافه میکنند
214
00:07:25,160 –> 00:07:27,470
صرفاً به این دلیل که ایده بزرگی وجود دارد که
215
00:07:27,470 –> 00:07:29,000
ما همه این مطالب عالی را منتشر میکنیم،
216
00:07:29,000 –> 00:07:30,770
اما هیچکس به ما نشان نمیدهد چگونه آنها را بازتولید
217
00:07:30,770 –> 00:07:32,600
کنیم و چگونه میتوانیم این نتایج را دوباره ایجاد کنیم
218
00:07:32,600 –> 00:07:34,520
و این بسیار مهم است و pachyderm
219
00:07:34,520 –> 00:07:36,260
است. این یکی از چیزهای اصلی آن است
220
00:07:36,260 –> 00:07:38,090
که باعث می شود نتایج فوراً
221
00:07:38,090 –> 00:07:39,740
تکرار شوند. من به نوعی به شما بچه ها نشان خواهم داد
222
00:07:39,740 –> 00:07:42,740
که در اینجا در یک ثانیه به چه معناست تا به
223
00:07:42,740 –> 00:07:45,200
نوعی آن طرف آخر را خلاصه کنم اگر اسلاید کنید
224
00:07:45,200 –> 00:07:47,840
اگر mmm داده ها به معنای همان
225
00:07:47,840 –> 00:07:48,770
شیوه های تولید باشد، کد
226
00:07:48,770 –> 00:07:50,630
خوب آن نسخه است.
227
00:07:50,630 –> 00:07:53,000
228
00:07:53,000 –> 00:07:54,710
اگر به توسعه دهندگان یا دانشمندان نیاز داریم که
229
00:07:54,710 –> 00:07:56,390
به خوبی توانمند شوند، اساساً برای داده ها دریافت می شود، به این
230
00:07:56,390 –> 00:07:58,430
معنی که کانتینرها و کانتینرها
231
00:07:58,430 –> 00:07:59,510
خطوط لوله داده یک و این
232
00:07:59,510 –> 00:08:01,160
در یک ثانیه در اینجا واقعاً قدرتمند می شود که من
233
00:08:01,160 –> 00:08:03,020
همچنین به شما نشان خواهم داد، اما سپس می
234
00:08:03,020 –> 00:08:05,300
تواند فوراً هر
235
00:08:05,300 –> 00:08:07,760
خروجی یا تصمیم قبلی را
236
00:08:07,760 –> 00:08:09,830
237
00:08:09,830 –> 00:08:11,300
238
00:08:11,300 –> 00:08:14,270
که ضروری است بازسازی کند. ما
239
00:08:14,270 –> 00:08:16,729
باید بتوانیم کار خود را به درستی نشان دهیم و بنابراین
240
00:08:16,729 –> 00:08:18,169
این اصل و نسب داده است و اینها
241
00:08:18,169 –> 00:08:19,880
همه چیزهایی هستند که pachyderm واقعاً بر
242
00:08:19,880 –> 00:08:22,190
روی ارائه آنها از دیدگاه منبع باز متمرکز است.
243
00:08:22,190 –> 00:08:25,400
244
00:08:25,400 –> 00:08:26,960
245
00:08:26,960 –> 00:08:29,570
جزئیات،
246
00:08:29,570 –> 00:08:30,800
درست نسخهسازی دادهها به چه معناست،
247
00:08:30,800 –> 00:08:32,780
بنابراین
248
00:08:32,780 –> 00:08:35,030
اگر
249
00:08:35,030 –> 00:08:37,729
به مجموعه دادهای فکر میکنید که ما واقعاً
250
00:08:37,729 –> 00:08:40,669
نسخه 1.8 را منتشر کردهایم، توانایی شناسایی و بازگرداندن هرگونه تغییر دادههای بد را داریم و یکی از این
251
00:08:40,669 –> 00:08:42,110
قابلیتها این است که بتوانیم دادههای ساختاریافته را بگیریم.
252
00:08:42,110 –> 00:08:44,420
و سپس به طور خودکار
253
00:08:44,420 –> 00:08:46,190
آن را تقسیم می کند تا بتواند
254
00:08:46,190 –> 00:08:48,620
در یک خوشه توزیع شود، اما از یک نظر بسیار
255
00:08:48,620 –> 00:08:50,150
عالی به نظر می رسد، اما واقعاً چه کاری انجام می
256
00:08:50,150 –> 00:08:52,220
دهد – به معنای Prov شناسایی و
257
00:08:52,220 –> 00:08:55,490
نسخهسازی همان چیزی است که یک پایگاه داده
258
00:08:55,490 –> 00:08:57,470
منفرد یا یک فایل منفرد بود که
259
00:08:57,470 –> 00:08:59,420
دادههای ساختار یافته بود زمانی که متعهد شد
260
00:08:59,420 –> 00:09:02,269
و در یک مخزن pachyderm تقسیم شد، هر ردیف
261
00:09:02,269 –> 00:09:04,339
میتواند به فایل جداگانه خود تقسیم شود
262
00:09:04,339 –> 00:09:07,189
و سپس دادهها یا نسخهسازی aleca
263
00:09:07,189 –> 00:09:08,689
یا سیستم ردیابی ذاتی شود.
264
00:09:08,689 –> 00:09:10,670
همه چیز یک commit ID دریافت میکند، بنابراین آنچه
265
00:09:10,670 –> 00:09:13,730
قبلاً یک commit بزرگ یا یک فایل بزرگ بود
266
00:09:13,730 –> 00:09:16,189
را نمیتوان به تکههایی تقسیم کرد
267
00:09:16,189 –> 00:09:18,290
که در آن هر تکه یک
268
00:09:18,290 –> 00:09:19,970
شناسه commit دارد و میتوان آن را به طور کامل ردیابی کرد،
269
00:09:19,970 –> 00:09:22,160
بنابراین اگر به او فکر کنیم
270
00:09:22,160 –> 00:09:24,800
میخواهم یک ETL را اجرا کنم. خط لوله و
271
00:09:24,800 –> 00:09:26,089
من میخواهم همه این کارها را با این دادهها انجام
272
00:09:26,089 –> 00:09:29,060
دهم تا آنها را برای آماده کردن نتیجهی گفته شده آماده
273
00:09:29,060 –> 00:09:31,459
274
00:09:31,459 –> 00:09:33,259
کنم، اگر
275
00:09:33,259 –> 00:09:35,540
به گرافیک سمت راست یکی از
276
00:09:35,540 –> 00:09:37,339
این چیزهایی که میدانید نگاه کنید، میتوانید فوراً به خاطر بیاورید و به آنچه درج کردهام برگردید. درست مثل
277
00:09:37,339 –> 00:09:39,980
دیگری نیست همه در جاده کار می کنند یا
278
00:09:39,980 –> 00:09:42,560
قایق را در آب می رانند و ما می توانیم
279
00:09:42,560 –> 00:09:44,389
ببینیم که چگونه داده گاهی تزریق می شود و
280
00:09:44,389 –> 00:09:46,519
مانند بقیه نیست و بنابراین باید
281
00:09:46,519 –> 00:09:48,500
آن را حذف کنیم و بنابراین باید آن را حذف کنیم.
282
00:09:48,500 –> 00:09:51,860
دقت کنید و سپس روی
283
00:09:51,860 –> 00:09:53,120
پایداری چیزها به درستی تأثیر نگذارید
284
00:09:53,120 –> 00:09:55,550
تا واقعاً قدرتمند شود و
285
00:09:55,550 –> 00:09:56,750
این یکی از چیزهایی است که ما تولید می کنیم
286
00:09:56,750 –> 00:09:58,129
و من نمونه ای از آن خط لوله کانتینری را به شما نشان می دهم.
287
00:09:58,129 –> 00:10:01,069
288
00:10:01,069 –> 00:10:03,019
289
00:10:03,019 –> 00:10:04,879
بهویژه
290
00:10:04,879 –> 00:10:06,740
کانتینرهای docker که روی kubernetes اجرا میشوند،
291
00:10:06,740 –> 00:10:08,990
این روشی است که ما
292
00:10:08,990 –> 00:10:11,269
به شما این امکان را میدهیم که توسعهدهندگان را
293
00:10:11,269 –> 00:10:12,350
با آزادی ابزارهایی که برای استفاده از آنها نیاز دارند،
294
00:10:12,350 –> 00:10:14,569
به شما ارائه دهیم، اگر عملیاتهایی دارید
295
00:10:14,569 –> 00:10:16,129
که دائماً به شما
296
00:10:16,129 –> 00:10:17,779
فشار میآورد اوه نه من. من آن را نصب نمیکنم،
297
00:10:17,779 –> 00:10:19,670
زیرا این برای من کار بسیار زیادی است،
298
00:10:19,670 –> 00:10:21,139
اما اگر از آنها بپرسید که آیا داکر
299
00:10:21,139 –> 00:10:23,209
دارند یا خیر، اغلب از داکر پشتیبانی میکنند که
300
00:10:23,209 –> 00:10:25,579
میگویند بله یا در حال ارزیابی هستند، بنابراین
301
00:10:25,579 –> 00:10:27,709
pachyderm از ظروف استفاده میکند و
302
00:10:27,709 –> 00:10:30,350
مهمتر از آن به همان اندازه مهم است.
303
00:10:30,350 –> 00:10:32,899
باید بگویم kubernetes و این به
304
00:10:32,899 –> 00:10:34,309
ما این توانایی را میدهد که نوشتن را مقیاسبندی کنیم و
305
00:10:34,309 –> 00:10:37,189
از چیزهایی مانند پردازندههای گرافیکی استفاده کنیم و
306
00:10:37,189 –> 00:10:39,259
تقریباً در هر جایی درست روی Prem off Prem
307
00:10:39,259 –> 00:10:44,089
در ابر هیبریدی ابری اجرا کنیم. d و به همین ترتیب، اما
308
00:10:44,089 –> 00:10:46,309
مهمتر از آن، برای شما بچهها فکر میکنم که
309
00:10:46,309 –> 00:10:47,509
کانتینرهای موجود در این
310
00:10:47,509 –> 00:10:49,459
خطوط لوله کانتینری واقعاً به ما اجازه میدهند که
311
00:10:49,459 –> 00:10:51,410
کل خط لوله خود را همانطور
312
00:10:51,410 –> 00:10:53,089
که در قبل به شما نشان دادم انجام دهیم و
313
00:10:53,089 –> 00:10:55,759
به جای اینکه
314
00:10:55,759 –> 00:10:57,649
آنها را به عنوان چیزهایی در نظر بگیریم. که ما روی
315
00:10:57,649 –> 00:11:00,920
یک یا چند مورد مشابه به عنوان یک
316
00:11:00,920 –> 00:11:02,449
نوع رشته با هم چیده می شویم تا جایی که
317
00:11:02,449 –> 00:11:03,730
همه چیز مستقل
318
00:11:03,730 –> 00:11:05,589
از دیگری است و سپس می توانید خروجی فردی همه چیز را دنبال کنید،
319
00:11:05,589 –> 00:11:08,380
بنابراین یک
320
00:11:08,380 –> 00:11:09,880
مثالی که داشتیم این بود که من
321
00:11:09,880 –> 00:11:11,709
با مشتری کار می کردم که علم دادههای ژنومی را انجام میدهد
322
00:11:11,709 –> 00:11:14,170
و آنها همه این نمونهها
323
00:11:14,170 –> 00:11:15,730
را از میدان و
324
00:11:15,730 –> 00:11:17,320
مناطق مختلف جهان دریافت کردهاند و
325
00:11:17,320 –> 00:11:19,029
باید برای هر
326
00:11:19,029 –> 00:11:21,550
دانشمندی که باید نوع
327
00:11:21,550 –> 00:11:24,160
خاص خود را ETL یا بازسازی
328
00:11:24,160 –> 00:11:26,410
دادههای نمونه را انجام دهند. آنها می توانستند آن را به آن
329
00:11:26,410 –> 00:11:28,120
دانشمند نیمکت نشین برسانند و اگر تصور کنید برای
330
00:11:28,120 –> 00:11:30,279
تیم محاسباتی
331
00:11:30,279 –> 00:11:33,040
که همه اینها را به طور موقت اجرا می کرد همه چیز
332
00:11:33,040 –> 00:11:35,050
مستقل بود، واقعاً هیچ
333
00:11:35,050 –> 00:11:36,820
بازتولیدی وجود نداشت. گامهای مفید و بهگونهای که
334
00:11:36,820 –> 00:11:39,339
چالشهای زیادی ایجاد میکند و بنابراین این شرکت
335
00:11:39,339 –> 00:11:40,740
این افراد واقعاً درخشان را استخدام میکند
336
00:11:40,740 –> 00:11:44,079
تا اساساً میدانید که
337
00:11:44,079 –> 00:11:45,760
اسکریپتها را در تمام طول روز مدیریت کنند و این واقعاً
338
00:11:45,760 –> 00:11:47,110
خستهکننده بود، اما وقتی از
339
00:11:47,110 –> 00:11:48,730
pachyderm استفاده میکنند، میتوانند به نوعی
340
00:11:48,730 –> 00:11:50,709
چیزها را مستقل اعلام کنند. از
341
00:11:50,709 –> 00:11:52,720
یکدیگر و سپس آنها را به هم گره بزنید تا
342
00:11:52,720 –> 00:11:54,370
جایی که این رفتارها
343
00:11:54,370 –> 00:11:56,199
شبیه به هم هستند اما کاملاً یکسان نیستند، بتوانند
344
00:11:56,199 –> 00:11:57,550
آنها را در خطوط لوله مختلف تعریف کنند و
345
00:11:57,550 –> 00:11:59,560
سپس این خطوط لوله را به هم زنجیر کنند،
346
00:11:59,560 –> 00:12:02,350
همچنین می دانید با شما چیز بزرگ دیگری می دانید
347
00:12:02,350 –> 00:12:03,820
و من در این پازل قرار می دهم.
348
00:12:03,820 –> 00:12:07,149
اکنون این توانایی وجود دارد که کد
349
00:12:07,149 –> 00:12:09,880
بسیاری از روشهای تولید یا دادهها را به ارث میبرد،
350
00:12:09,880 –> 00:12:12,699
ما میتوانیم
351
00:12:12,699 –> 00:12:15,370
کارهایی مانند CI CD
352
00:12:15,370 –> 00:12:17,079
را به روشی واقعیتر و به روشی ملموستر انجام دهیم، زیرا ما در حال
353
00:12:17,079 –> 00:12:21,850
آزمایش دادهها هستیم، درست مانند کدها.
354
00:12:21,850 –> 00:12:24,639
در مورد اینکه چرا باید بگوییم
355
00:12:24,639 –> 00:12:26,620
خط لوله یادگیری شبه و و ماشین یک درخواست کششی است،
356
00:12:26,620 –> 00:12:28,480
من در واقع همین الان جریان مکعب باز کردن را دارم،
357
00:12:28,480 –> 00:12:31,959
اما شما واقعاً میدانید
358
00:12:31,959 –> 00:12:33,850
که چه چیزی میتوانم به شما نشان میدهد.
359
00:12:33,850 –> 00:12:35,290
شما می توانید داده های خود را بردارید و می توانید آنها را
360
00:12:35,290 –> 00:12:37,540
از قبل پردازش کنید، می توانید آنها را نسخه
361
00:12:37,540 –> 00:12:39,250
برداری کنید و سپس می توانید
362
00:12:39,250 –> 00:12:42,310
جریان مکعب اهرمی و سلدون را بشناسید که
363
00:12:42,310 –> 00:12:44,470
نه تنها آن را روی سخت افزار واقعی اجرا کند یا
364
00:12:44,470 –> 00:12:46,690
آن بارهای کاری را توزیع کند، بلکه شما نیز به
365
00:12:46,690 –> 00:12:48,790
سلول وارد شده اید. مانند سرویس دادن به بخشها
366
00:12:48,790 –> 00:12:50,350
یا مدلهای مختلف به گونهای که در
367
00:12:50,350 –> 00:12:52,750
اسلاید قبلی که هر جنبه از
368
00:12:52,750 –> 00:12:54,880
خط لوله شما توسط شما تعریف میشود، ساخته میشود و
369
00:12:54,880 –> 00:12:56,769
میتوانید از ابزارها و خدماتی که منطقی هستند استفاده کنید
370
00:12:56,769 –> 00:12:57,310
،
371
00:12:57,310 –> 00:12:59,199
بنابراین اگر Selden چیزی است که شما بچهها
372
00:12:59,199 –> 00:13:02,019
از آن برای خدمت به مغولها استفاده میکردید. به این دلیل
373
00:13:02,019 –> 00:13:04,779
که اجرای آن بسیار ساده است، فقط
374
00:13:04,779 –> 00:13:06,339
اضافه کردن یک خط لوله دیگر که مشخصات خط لوله را می دانید
375
00:13:06,339 –> 00:13:08,920
به کل خط لوله خود اضافه کنید
376
00:13:08,920 –> 00:13:10,690
و بسیار ساده می شود
377
00:13:10,690 –> 00:13:12,189
که این چیزها را به یکدیگر زنجیره بزنید
378
00:13:12,189 –> 00:13:14,110
و منشأ و اصل و نسب خود را
379
00:13:14,110 –> 00:13:16,290
در کل پروژه
380
00:13:16,290 –> 00:13:18,910
به Providence که من در مورد آن صحبت کردم، حفظ کنید.
381
00:13:18,910 –> 00:13:20,350
من چندین بار
382
00:13:20,350 –> 00:13:22,480
در مورد ردیابی هر نسخه از آن داده ها
383
00:13:22,480 –> 00:13:25,900
در کد صحبت کرده ام، بنابراین اگر چیزی را ورودی قرار دهیم و
384
00:13:25,900 –> 00:13:27,580
سپس چیزی را خروجی دهیم یا آن را
385
00:13:27,580 –> 00:13:29,620
در بین e تغییر دهیم. خیلی چیزها ردیابی میشوند و
386
00:13:29,620 –> 00:13:31,420
همه چیز یک شناسه commit دریافت میکند، بنابراین ما میتوانیم آن را تا آخر
387
00:13:31,420 –> 00:13:33,190
ردیابی کنیم و بگوییم
388
00:13:33,190 –> 00:13:34,600
این چیزها از کجا شروع شد و چگونه به
389
00:13:34,600 –> 00:13:36,520
این شکل ختم شد و من درباره
390
00:13:36,520 –> 00:13:37,930
شما بچهها نمیدانم، اما این به من کمک زیادی کرده است.
391
00:13:37,930 –> 00:13:40,300
با برخی از مدلهای من، صرفاً به این دلیل
392
00:13:40,300 –> 00:13:43,270
که میدانید دادهها
393
00:13:43,270 –> 00:13:45,040
در یک نقطه از یک
394
00:13:45,040 –> 00:13:46,630
فریم داده به فریم داده دیگر تغییر ساختار میدهند یا تغییر میکنند و چیزها به
395
00:13:46,630 –> 00:13:49,330
نوعی در اطراف ادغام میشوند و سپس من
396
00:13:49,330 –> 00:13:51,340
چهار ساعت آنجا مینشینم و میخواهم
397
00:13:51,340 –> 00:13:54,190
چرا این چیزی است. کاملاً اشتباه بود
398
00:13:54,190 –> 00:13:55,510
به این دلیل در یک نقطه من این
399
00:13:55,510 –> 00:13:57,670
ساختار یا این تغییر را در چارچوب دادهام انجام دادم
400
00:13:57,670 –> 00:13:59,590
و همه چیز را به هم ریخت و
401
00:13:59,590 –> 00:14:01,240
من واقعاً نتوانستم آن را
402
00:14:01,240 –> 00:14:02,740
بدون منشأ ردیابی کنم که چرا
403
00:14:02,740 –> 00:14:04,360
pachyderm آن را بسیار آسانتر کرده است. برای اینکه
404
00:14:04,360 –> 00:14:06,060
من این کارها را انجام دهم
405
00:14:06,060 –> 00:14:09,910
نمودار پشته سریع شما اساساً
406
00:14:09,910 –> 00:14:11,890
می دانید همانطور که گفتم ما در بالای kubernetes اجرا می
407
00:14:11,890 –> 00:14:14,050
کنیم ما این موتور pachyderm را داریم که
408
00:14:14,050 –> 00:14:17,230
می دانید که به نوعی در بالا زندگی می کند
409
00:14:17,230 –> 00:14:19,120
ما این سیستم فایل pachyderm را داریم که شبیه
410
00:14:19,120 –> 00:14:21,760
به سیستم فایل Hadoop نیست. اما برخی
411
00:14:21,760 –> 00:14:23,590
از مفاهیم مشابه وجود دارد اما
412
00:14:23,590 –> 00:14:25,420
اساساً سیستم فایل توزیع شده در سراسر
413
00:14:25,420 –> 00:14:27,400
شما یک خوشه بزرگ را می شناسید و سپس این
414
00:14:27,400 –> 00:14:28,780
همه چیزهای منبع باز ما هستند
415
00:14:28,780 –> 00:14:30,910
416
00:14:30,910 –> 00:14:32,920
417
00:14:32,920 –> 00:14:34,030
. مانند
418
00:14:34,030 –> 00:14:36,070
آمار داشبورد و کنترلهای دسترسی،
419
00:14:36,070 –> 00:14:37,780
چیزهای بیشتری که فکر میکنم عملیاتها
420
00:14:37,780 –> 00:14:39,340
مهمتر هستند به آنها علاقهمند هستند،
421
00:14:39,340 –> 00:14:41,530
اما در واقع همه چیزهایی را که
422
00:14:41,530 –> 00:14:43,900
امروز به شما نشان دادهام،
423
00:14:43,900 –> 00:14:45,490
میتوانید کاملاً در موتور منبع باز ما
424
00:14:45,490 –> 00:14:47,290
استفاده کنید و واقعاً قدرتمند و
425
00:14:47,290 –> 00:14:49,930
واقعاً جالب است، بنابراین بیایید
426
00:14:49,930 –> 00:14:51,100
این را در عمل انجام دهید و سپس من به
427
00:14:51,100 –> 00:14:52,780
یک نسخه نمایشی کوچک می روم که در آن می توانیم
428
00:14:52,780 –> 00:14:54,700
کدها و نمونه های واقعی را
429
00:14:54,700 –> 00:14:56,530
430
00:14:56,530 –> 00:14:57,670
431
00:14:57,670 –> 00:14:59,590
بررسی کنیم. وقتی می
432
00:14:59,590 –> 00:15:01,390
گوییم منشأ داده ها و اصل و نسب داده ها
433
00:15:01,390 –> 00:15:03,100
و تأثیری که دارد، همانطور که ما به آن
434
00:15:03,100 –> 00:15:04,690
فکر می کنیم یا امیدواریم در پس
435
00:15:04,690 –> 00:15:06,130
ذهن شما می گوییم، شما به این فکر می کنید که من چگونه هستم، چه می گوییم.
436
00:15:06,130 –> 00:15:08,560
بدون در نظر گرفتن پاکیدرم، با آن برخورد می کنم و جریان کار من درست است
437
00:15:08,560 –> 00:15:10,840
، اما اگر به
438
00:15:10,840 –> 00:15:13,180
Gdpr فکر کنیم، فکر می کنم همه ما
439
00:15:13,180 –> 00:15:15,880
حداقل با این موضوع آشنایی داریم، از این
440
00:15:15,880 –> 00:15:17,170
نظر که شما در مورد آن شنیده اید یا
441
00:15:17,170 –> 00:15:18,820
کسانی را می شناسید که این مخفف را می شناسید، اما
442
00:15:18,820 –> 00:15:20,560
اساسا به شما می دهد که یک دسته از شهروندان اروپایی را می شناسید.
443
00:15:20,560 –> 00:15:22,720
حقوق مربوط به نحوه
444
00:15:22,720 –> 00:15:24,550
استفاده از داده های آنها در نحوه محافظت
445
00:15:24,550 –> 00:15:26,680
از آن است که یکی از آنها می تواند فقط
446
00:15:26,680 –> 00:15:28,540
حق توضیح را داشته باشد، بنابراین اگر برخی از
447
00:15:28,540 –> 00:15:29,500
آنها به نتیجه ای
448
00:15:29,500 –> 00:15:32,320
رسیدید، حق دارید که یک انسان کامل
449
00:15:32,320 –> 00:15:36,640
تفسیر کنید، دلیل اصلی آن را می دانید. چه
450
00:15:36,640 –> 00:15:38,170
اتفاقی افتاد و چرا به این شکل اتفاق افتاد،
451
00:15:38,170 –> 00:15:40,180
اما اگر نمیدانید اگر
452
00:15:40,180 –> 00:15:41,410
این شرکتها هستند، میدانید که آیا
453
00:15:41,410 –> 00:15:42,430
شرکتهایی هستند که از یادگیری ماشینی استفاده میکنند
454
00:15:42,430 –> 00:15:43,870
، هنوز تعداد زیادی از آن جعبه سیاه وجود دارد
455
00:15:43,870 –> 00:15:46,000
و اگر به آن فکر کنیم، اگر داشته باشیم.
456
00:15:46,000 –> 00:15:47,800
دسته ای از کاربران در یک پایگاه داده و ما
457
00:15:47,800 –> 00:15:49,990
آموزش می دهیم که می دانید یک
458
00:15:49,990 –> 00:15:52,120
مدل یادگیری ماشینی را آموزش داده اند که بله یا خیر بگوید چه
459
00:15:52,120 –> 00:15:54,760
کسی وام بانکی بگیرد یا
460
00:15:54,760 –> 00:15:56,830
اگر بخواهم در آمازون
461
00:15:56,830 –> 00:15:58,750
یک جور در بیاورم اما آنها یک هنر بزرگ نوشتند. در مورد اینکه چگونه
462
00:15:58,750 –> 00:16:01,210
463
00:16:01,210 –> 00:16:02,950
سیستم هوش مصنوعی شغلی خود را خاموش کردند، زیرا
464
00:16:02,950 –> 00:16:05,050
توسط زنان منبع به این
465
00:16:05,050 –> 00:16:06,220
دلیل مشابه بود، آنها مجموعه ای از
466
00:16:06,220 –> 00:16:07,180
داده ها را به سمت آن پرتاب کردند، اما آنها واقعاً متوجه نشدند که
467
00:16:07,180 –> 00:16:09,430
از چه داده هایی برای
468
00:16:09,430 –> 00:16:11,620
آموزش آن مدل استفاده می شود.
469
00:16:11,620 –> 00:16:13,240
تجزیه و تحلیل عمیقی انجام دادند و
470
00:16:13,240 –> 00:16:16,000
فهمیدند که زبان مردانه زیادی
471
00:16:16,000 –> 00:16:19,300
در آن وجود دارد و بنابراین کاندیداهایی که
472
00:16:19,300 –> 00:16:20,530
زبان زنانه بیشتری در رزومه خود داشتند
473
00:16:20,530 –> 00:16:21,970
به انتها می رسیدند و
474
00:16:21,970 –> 00:16:23,710
تا دیروقت متوجه نشدند که
475
00:16:23,710 –> 00:16:25,600
میلیون ها دلار درآمد داشته اند. سرمایه گذاری شده است، اما
476
00:16:25,600 –> 00:16:28,090
شما می دانید و مفهوم تولید ناخالص
477
00:16:28,090 –> 00:16:30,160
داخلی این چنین است، بنابراین
478
00:16:30,160 –> 00:16:32,170
ما این پایگاه داده از کاربران یا پایگاه داده
479
00:16:32,170 –> 00:16:34,360
محتوا یا داده ها را داریم، آن را آموزش می دهیم تا
480
00:16:34,360 –> 00:16:37,380
تصمیمی را اتخاذ کند و
481
00:16:37,380 –> 00:16:39,520
امیدواریم که همه چیز پیش برود. انگشتان ما به
482
00:16:39,520 –> 00:16:41,589
درستی روی هم قرار گرفته اند، هیچ کس تناسب ندارد، اما
483
00:16:41,589 –> 00:16:44,050
با تولید ناخالص داخلی ما این باعث می شود که شما
484
00:16:44,050 –> 00:16:46,540
خیلی چیزها را بدانید، می دانید که کاربران روشی دارند که توسط قانون حمایت می
485
00:16:46,540 –> 00:16:48,550
شود تا توضیحی را در مورد
486
00:16:48,550 –> 00:16:51,040
آن نتیجه به شما بفهمانند و بنابراین اگر
487
00:16:51,040 –> 00:16:53,440
منشأ یا منشأ خاصی ندارید. اصل و نسب یا
488
00:16:53,440 –> 00:16:55,660
هر دو از نظر فناوری و همچنین
489
00:16:55,660 –> 00:16:58,990
فرآیند کسب و کار رسیدن به آن
490
00:16:58,990 –> 00:17:01,570
خروجی واقعاً به دلیل اتخاذ
491
00:17:01,570 –> 00:17:05,230
این تصمیم یک فرآیند بسیار سخت و
492
00:17:05,230 –> 00:17:07,089
گاهی غیرممکن است که واقعاً میتواند
493
00:17:07,089 –> 00:17:10,359
مشکلاتی ایجاد کند، بنابراین با
494
00:17:10,359 –> 00:17:12,310
پوسته پوسته پوسته شدن به نوعی شروع میشود.
495
00:17:12,310 –> 00:17:14,020
شکل کمی متفاوت است، بنابراین
496
00:17:14,020 –> 00:17:16,569
همانطور که گفتم هر چیزی را که در یک
497
00:17:16,569 –> 00:17:18,490
مخزن قرار می دهید و pachyderm به یک انجمن می رسد
498
00:17:18,490 –> 00:17:20,709
درست فکر کنید دقیقاً همانطور
499
00:17:20,709 –> 00:17:22,750
که شما کد را با git
500
00:17:22,750 –> 00:17:24,970
چک می کنید زمانی که وقتی کد جدید را بررسی می کنید یک commit دریافت می
501
00:17:24,970 –> 00:17:27,609
کند. شناسه آن در یک مخزن است، شما میدانید،
502
00:17:27,609 –> 00:17:28,870
سپس میدانید که میتوانید
503
00:17:28,870 –> 00:17:30,640
ظروف خود را برای اصلاح تمام
504
00:17:30,640 –> 00:17:32,500
مدلهای موهایتان بکارید و سپس میتوانید آن مدل
505
00:17:32,500 –> 00:17:34,000
را ارائه کنید، چه سلدون یا هر چیز دیگری که
506
00:17:34,000 –> 00:17:36,910
میخواهید استفاده کنید و ما به همان نقطه
507
00:17:36,910 –> 00:17:39,100
میرسیم که جارد به آنجا میرود. صبر کن چرا میدانستی
508
00:17:39,100 –> 00:17:41,110
یا من مادرم را نمیخواهم میدانی من
509
00:17:41,110 –> 00:17:42,230
نمیدانم چرا تأیید نشدم
510
00:17:42,230 –> 00:17:44,210
یا در این مورد خاص میدانی
511
00:17:44,210 –> 00:17:47,000
من نمیخواهم از اطلاعات من برای
512
00:17:47,000 –> 00:17:48,830
ایجاد سیستمهای خودکار استفاده شود که
513
00:17:48,830 –> 00:17:50,780
یک حق Gdpr دیگر است. y میتوان گفت که
514
00:17:50,780 –> 00:17:54,169
من نمیخواهم از دادههایم در
515
00:17:54,169 –> 00:17:57,169
هیچ روش آموزشی خودکاری استفاده شود، بنابراین
516
00:17:57,169 –> 00:17:58,520
اگر حل این مشکل واقعاً ساده است، چه کاری میتوانید انجام دهید این است که
517
00:17:58,520 –> 00:18:00,380
جارد دست را بالا میبرد و
518
00:18:00,380 –> 00:18:02,450
میگوید