در این مطلب، ویدئو کاوش داده های پیوندی چند بعدی با چسب | SciPy 2019 | توماس روبیتای با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:30:13
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:00,989
از شما برای معرفی بسیار
2
00:00:00,989 –> 00:00:02,370
سپاسگزارم و از برگزارکنندگان بابت
3
00:00:02,370 –> 00:00:05,240
فرصتی که به من دادند تا در اینجا صحبت کنم بسیار سپاسگزارم،
4
00:00:05,240 –> 00:00:07,680
بنابراین من یک توسعه دهنده نرم افزار علمی
5
00:00:07,680 –> 00:00:09,750
در یک نرم افزار پاریس در بریتانیا هستم و
6
00:00:09,750 –> 00:00:12,480
من توسعه دهنده اصلی چسب هستم، بنابراین چسب یک کار
7
00:00:12,480 –> 00:00:14,490
چند رشته ای است. بسته پایتون برای
8
00:00:14,490 –> 00:00:16,170
9
00:00:16,170 –> 00:00:18,480
اکتشاف دادههای چند بعدی و پیوندی و نوع کاوش دادههای پیوندی که
10
00:00:18,480 –> 00:00:19,949
11
00:00:19,949 –> 00:00:22,199
در این گفتگو با جزئیات بیشتر توضیح خواهم داد یا
12
00:00:22,199 –> 00:00:24,570
منظور ما از آن چیست،
13
00:00:24,570 –> 00:00:26,640
بنابراین انگیزههای ساخت چسب
14
00:00:26,640 –> 00:00:29,910
به شرح زیر بود، بنابراین اولین مورد
15
00:00:29,910 –> 00:00:32,250
این روزها داده ها بسیار ابعادی هستند،
16
00:00:32,250 –> 00:00:34,500
بنابراین من فقط در مورد این واقعیت صحبت نمی کنم
17
00:00:34,500 –> 00:00:35,850
که شما می توانید تصاویر،
18
00:00:35,850 –> 00:00:37,230
مکعب ها و ابرمکعب ها را بشناسید،
19
00:00:37,230 –> 00:00:39,899
بلکه به طور کلی اگر
20
00:00:39,899 –> 00:00:41,969
جدولی از داده ها دارید، به
21
00:00:41,969 –> 00:00:44,610
اندازه ستون ها ابعاد دارید و می دانید وقتی
22
00:00:44,610 –> 00:00:45,719
ستونهای زیادی دارید، باید
23
00:00:45,719 –> 00:00:48,600
بتوانید آنها را به صورت تعاملی کاوش کنید تا به
24
00:00:48,600 –> 00:00:51,170
دنبال روندها و غیره در دادهها بگردید،
25
00:00:51,170 –> 00:00:54,899
حالا نکته دیگر این است که بسیاری از
26
00:00:54,899 –> 00:00:58,530
اوقات دادهها ساده نیستند،
27
00:00:58,530 –> 00:01:00,840
شما ناهمگن هستند. ترکیبی از
28
00:01:00,840 –> 00:01:02,730
انواع مختلف دادهها بسیار نادر است که
29
00:01:02,730 –> 00:01:05,760
محققین اساساً
30
00:01:05,760 –> 00:01:08,430
شما یک فایل واحد را
31
00:01:08,430 –> 00:01:10,530
بشناسند که همه چیز را در مورد پروژه در
32
00:01:10,530 –> 00:01:12,750
آن داشته باشید و سپس بتوانید آن فایل را در واقعیت تجزیه و تحلیل
33
00:01:12,750 –> 00:01:15,119
34
00:01:15,119 –> 00:01:17,430
کنید. یا چندین تصویر
35
00:01:17,430 –> 00:01:19,350
ممکن است در شبکههای مختلف بر اساس متفاوت درجهبندی شوند
36
00:01:19,350 –> 00:01:22,170
و سپس جداول
37
00:01:22,170 –> 00:01:23,040
دادهها و غیره را
38
00:01:23,040 –> 00:01:24,810
نیز میشناسید، بنابراین ایده این است که ما باید بتوانیم
39
00:01:24,810 –> 00:01:26,840
همه این مجموعههای داده را به هم پیوند دهیم و
40
00:01:26,840 –> 00:01:29,210
همزمان آنها را به صورت بصری بررسی کنیم.
41
00:01:29,210 –> 00:01:32,130
انگیزه سوم که بسیاری
42
00:01:32,130 –> 00:01:34,890
از مواقع دانشمندان به زیرمجموعه ای از داده ها علاقه مند هستند
43
00:01:34,890 –> 00:01:36,990
، بنابراین منظورم این است که
44
00:01:36,990 –> 00:01:38,520
مواردی وجود دارد که شما متوجه می شوید که
45
00:01:38,520 –> 00:01:39,960
کل داده ها در تمام زمان هایی که
46
00:01:39,960 –> 00:01:41,970
واقعاً علاقه مند به کاوش هستید،
47
00:01:41,970 –> 00:01:44,159
یک مجموعه داده بسیار بزرگ را می شناسید و
48
00:01:44,159 –> 00:01:46,409
در مورد بسیار جالب تحقیق می کنید. زیرمجموعههایی که
49
00:01:46,409 –> 00:01:49,890
میدانید ممکن است زیرمجموعههای غیرعادی از دادهها باشند، بنابراین
50
00:01:49,890 –> 00:01:51,240
ما به روشهایی برای ساختن و
51
00:01:51,240 –> 00:01:53,460
ترکیب دادههای انتخابی در این
52
00:01:53,460 –> 00:01:55,290
فضای ابعادی بالا در بین فایلهای متعدد نیاز داریم
53
00:01:55,290 –> 00:01:57,740
تا این موضوع باشد. vation برای
54
00:01:57,740 –> 00:02:00,960
e-blue یک بسته پایتون است که با آن نوشته
55
00:02:00,960 –> 00:02:03,899
شده است و باید بگویم این
56
00:02:03,899 –> 00:02:06,479
بسته پایتون است، همچنین یک کتابخانه است، یک
57
00:02:06,479 –> 00:02:08,340
برنامه کاربردی است، بنابراین
58
00:02:08,340 –> 00:02:11,550
جنبه های مختلفی از چسب وجود دارد که دارای یک رابط QT است
59
00:02:11,550 –> 00:02:13,069
که ما
60
00:02:13,069 –> 00:02:16,010
در سال 2011 توسعه آن را شروع کرده ایم.
61
00:02:16,010 –> 00:02:18,230
الان کاملاً بالغ شده است و از سال گذشته
62
00:02:18,230 –> 00:02:19,819
که ما کار روی رابط مشتری را شروع کردهایم،
63
00:02:19,819 –> 00:02:21,920
64
00:02:21,920 –> 00:02:25,250
در این سخنرانی در مورد آن صحبت
65
00:02:25,250 –> 00:02:27,290
خواهم کرد، بنابراین من فقط میخواهم نمونهای از یک
66
00:02:27,290 –> 00:02:29,599
جلسه چسب را نشان دهم تا شما تصوری از
67
00:02:29,599 –> 00:02:32,120
پسر داشته باشید. چرا به نظر می رسد این
68
00:02:32,120 –> 00:02:35,420
رابط چسب اصلی در بالا سمت چپ
69
00:02:35,420 –> 00:02:37,579
اینجاست، شما اساساً منطقه ای را
70
00:02:37,579 –> 00:02:40,040
دارید که می دانید مجموعه داده ها و زیرمجموعه ها را می بینید، این
71
00:02:40,040 –> 00:02:41,450
ناحیه اصلی در وسط جایی است که
72
00:02:41,450 –> 00:02:43,549
شما تجسم می کنید و بیت
73
00:02:43,549 –> 00:02:45,079
سمت چپ جایی است که شما گزینههایی دارید که
74
00:02:45,079 –> 00:02:48,620
جنبههای تجسمها را کنترل میکنند، بنابراین
75
00:02:48,620 –> 00:02:50,030
من یک فایل داده را بارگیری میکنم
76
00:02:50,030 –> 00:02:53,659
که اساساً انتقال آن از
77
00:02:53,659 –> 00:02:56,389
هواپیماهای منطقه بوستون در حدود یک
78
00:02:56,389 –> 00:03:00,680
ماه با استفاده از پیامهای SB آگهی است و بنابراین
79
00:03:00,680 –> 00:03:02,689
میتوانید یک مجموعه داده را روی بوم بکشید. یک
80
00:03:02,689 –> 00:03:04,069
نوع تجسمی را که
81
00:03:04,069 –> 00:03:06,019
میخواهید انجام دهید انتخاب کنید، این است که یک
82
00:03:06,019 –> 00:03:08,750
نمودار پراکنده از موقعیت هواپیماها
83
00:03:08,750 –> 00:03:11,299
در x و y فقط نسبت به فرودگاه بوستون ایجاد میکند
84
00:03:11,299 –> 00:03:14,150
و میتوانید ببینید
85
00:03:14,150 –> 00:03:16,040
که همه نوع مسیرهای پرواز
86
00:03:16,040 –> 00:03:18,500
برای هواپیماها را میدانید. با گذشت زمان و همچنین یک
87
00:03:18,500 –> 00:03:22,129
پراکندگی کلی از نقاط وجود دارد، بنابراین
88
00:03:22,129 –> 00:03:23,510
میتوانید تجسمهای متعددی انجام
89
00:03:23,510 –> 00:03:25,699
دهید، میتوانید دادهها را بکشید و سپس بگویید خوب،
90
00:03:25,699 –> 00:03:27,919
اکنون میخواهم نموداری
91
00:03:27,919 –> 00:03:30,169
از ارتفاع
92
00:03:30,169 –> 00:03:31,970
هواپیما در مقابل سمت راست ایجاد کنم.
93
00:03:31,970 –> 00:03:34,370
جهت هواپیما به عنوان زاویه ای بین 0 تا
94
00:03:34,370 –> 00:03:37,669
360 درجه و می دانید که از قبل
95
00:03:37,669 –> 00:03:38,780
روندهای جالب و داده ها را مشاهده نمی کنید
96
00:03:38,780 –> 00:03:41,150
و سپس در سمت راست پایین،
97
00:03:41,150 –> 00:03:44,690
من فقط یک هیستوگرام 1 بعدی از داده ها را می سازم تا
98
00:03:44,690 –> 00:03:46,819
نرخ عمودی را نشان دهیم.
99
00:03:46,819 –> 00:03:48,319
که سرعت
100
00:03:48,319 –> 00:03:52,099
بالا یا پایین رفتن پنجره ها است، بنابراین ایده این است
101
00:03:52,099 –> 00:03:53,900
که در حال حاضر یک مجموعه داده واحد وجود دارد، اما ما
102
00:03:53,900 –> 00:03:55,430
تجسم های متعددی داریم که به
103
00:03:55,430 –> 00:03:58,010
طور خودکار به هم مرتبط می شوند زیرا
104
00:03:58,010 –> 00:03:59,930
داده های مشابهی را نشان می دهند و
105
00:03:59,930 –> 00:04:01,579
غیره این ابزار آبی در بالای هر
106
00:04:01,579 –> 00:04:04,250
بیننده ابزارهای انتخاب هستند، بنابراین میتوانید بروید
107
00:04:04,250 –> 00:04:06,379
و برخی از نقاط را انتخاب کنید، ما فقط
108
00:04:06,379 –> 00:04:08,510
میخواهیم یک انتخاب مستطیلی در اینجا انجام دهیم تا
109
00:04:08,510 –> 00:04:09,709
برخی از نقاطی را که به
110
00:04:09,709 –> 00:04:11,239
طور خودکار میبینیم، آنهایی را که
111
00:04:11,239 –> 00:04:13,729
هر گونه تجسمهای دیگر را برجسته میکند، به شما نشان دهیم.
112
00:04:13,729 –> 00:04:15,229
به نوعی می توانید آن را به عنوان یک
113
00:04:15,229 –> 00:04:16,880
داشبورد در نظر بگیرید که بسیار به صورت
114
00:04:16,880 –> 00:04:20,720
تعاملی ساخته اید و سپس البته
115
00:04:20,720 –> 00:04:21,798
ما می توانیم در تجسم های دیگر انتخاب هایی انجام دهیم
116
00:04:21,798 –> 00:04:23,960
و دوباره ببینیم که
117
00:04:23,960 –> 00:04:26,750
انتشار به سایر موارد وجود دارد، بنابراین در نهایت
118
00:04:26,750 –> 00:04:27,380
می خواهم
119
00:04:27,380 –> 00:04:30,250
قطارهایی را انتخاب کنم که در حال حاضر در حال نزول هستند و
120
00:04:30,250 –> 00:04:32,600
ببینید در سایر تجسمها کجا هستند،
121
00:04:32,600 –> 00:04:34,520
البته میدانید که
122
00:04:34,520 –> 00:04:36,470
اغلب میخواهید چندین انتخاب را کاوش کنید، ممکن است
123
00:04:36,470 –> 00:04:38,330
چندین نوع
124
00:04:38,330 –> 00:04:40,730
زیرمجموعه را کاوش کنید، بنابراین تا اینجا میتوانید در واقع
125
00:04:40,730 –> 00:04:43,220
انتخاب کنید که میخواهید یک زیرمجموعه جدید ایجاد کنید
126
00:04:43,220 –> 00:04:44,930
یا فقط زیرمجموعه موجود را جایگزین کنید.
127
00:04:44,930 –> 00:04:46,880
و میتوانیم به پایین سمت راست اینجا برویم
128
00:04:46,880 –> 00:04:49,490
و سپس اساساً تمام
129
00:04:49,490 –> 00:04:52,910
هواپیماهایی را که در حال حاضر بالا میروند انتخاب کنیم و
130
00:04:52,910 –> 00:04:55,010
سپس آنهایی را که با رنگ آبی مشخص شدهاند در
131
00:04:55,010 –> 00:05:00,050
تصویر دیگر ببینیم. خیلی خوب است، بنابراین
132
00:05:00,050 –> 00:05:01,130
خیلی وقتها چون فضایی با
133
00:05:01,130 –> 00:05:03,320
ابعاد بالا است، ممکن است بخواهید
134
00:05:03,320 –> 00:05:05,170
انتخابهایی را از
135
00:05:05,170 –> 00:05:07,460
تجسمهای متفاوت اساساً متفاوت از
136
00:05:07,460 –> 00:05:09,200
ابعاد مختلف ترکیب کنید، بنابراین آنچه در
137
00:05:09,200 –> 00:05:11,420
اینجا اتفاق افتاد این بود که من حالت را به
138
00:05:11,420 –> 00:05:13,820
نوعی حالت پایانی تغییر دادم که اساساً به معنای
139
00:05:13,820 –> 00:05:16,250
انجام دادن است. تقاطع انتخاب
140
00:05:16,250 –> 00:05:17,720
هایی که من به تازگی انجام داده ام با زیرمجموعه قبلی،
141
00:05:17,720 –> 00:05:19,610
بنابراین اکنون زیر مجموعه را محدود می کند
142
00:05:19,610 –> 00:05:22,210
نه اینکه هر بار فقط آن را جایگزین کند،
143
00:05:22,210 –> 00:05:25,250
بنابراین وقتی زیر مجموعه خود را
144
00:05:25,250 –> 00:05:26,900
دارید، می توانید در صورت تمایل آن را صادر کنید،
145
00:05:26,900 –> 00:05:28,820
بنابراین در این مورد ما می توانیم فقط انتخاب کنید کدام
146
00:05:28,820 –> 00:05:30,500
زیرمجموعه را صادر کنید و آن را به یک فایل CSV صادر
147
00:05:30,500 –> 00:05:35,180
کنید، بنابراین منظورم این است که
148
00:05:35,180 –> 00:05:36,560
میتوانید کارها را با چسب زیرمجموعه انجام دهید،
149
00:05:36,560 –> 00:05:38,330
اما این فقط یک راه آسان برای
150
00:05:38,330 –> 00:05:40,690
دریافت دادهها از آن است، اکنون انواع دیگری
151
00:05:40,690 –> 00:05:43,040
از تجسمها در چسب وجود دارد و فقط
152
00:05:43,040 –> 00:05:44,480
از آنجایی که فضای خالی ما تمام می شود، اما
153
00:05:44,480 –> 00:05:46,850
آن را تبدیل به یک برگه جدید کرد، اکنون می خواهم یک نمودار پراکندگی سه بعدی ایجاد
154
00:05:46,850 –> 00:05:49,340
کنم تا سعی کنم به شما نشان
155
00:05:49,340 –> 00:05:51,710
دهم یکی از زیر مجموعه ها را در فضای سه بعدی واقعی می شناسید،
156
00:05:51,710 –> 00:05:56,540
بنابراین XY و ارتفاع و بنابراین من g میتوان
157
00:05:56,540 –> 00:05:58,100
این را کمی نشان داد و
158
00:05:58,100 –> 00:05:59,510
کمی بعد به آن اشاره کرد، اما همچنین
159
00:05:59,510 –> 00:06:01,010
میتوانید هر نوع
160
00:06:01,010 –> 00:06:02,810
تجسم سفارشی را در چسب بسازید و
161
00:06:02,810 –> 00:06:04,760
فقط به انواعی که آنجا میبینید محدود
162
00:06:04,760 –> 00:06:07,850
نمیشوید، بنابراین من موارد مختلف را انتخاب میکنم.
163
00:06:07,850 –> 00:06:10,610
ویژگی هایی که باید در این بیننده نشان داده
164
00:06:10,610 –> 00:06:13,070
شود و من انتخاب کرده ام که فقط زیرمجموعه قرمز را نشان دهم،
165
00:06:13,070 –> 00:06:14,720
بنابراین این هواپیماها در
166
00:06:14,720 –> 00:06:17,900
حال نزول هستند و بنابراین، اکنون
167
00:06:17,900 –> 00:06:19,940
توزیع 3 بعدی آن
168
00:06:19,940 –> 00:06:21,470
نقاط را نشان می دهد که می توانید ببینید که
169
00:06:21,470 –> 00:06:22,700
در عرض یک دقیقه یک نوبت دارد.
170
00:06:22,700 –> 00:06:24,650
اساساً هواپیماها در ارتفاع بالایی هستند و
171
00:06:24,650 –> 00:06:26,450
اینها هواپیماها هستند و شما به تازگی
172
00:06:26,450 –> 00:06:28,220
فرود را شروع کرده اید، اما آنها احتمالاً باید
173
00:06:28,220 –> 00:06:30,260
در فرودگاه دیگری فرود بیایند و سپس تمام
174
00:06:30,260 –> 00:06:31,640
نقاط پایین آنهایی هستند که
175
00:06:31,640 –> 00:06:33,910
اکنون در فرودگاه بوستون در نمای سه بعدی فرود می آیند.
176
00:06:33,910 –> 00:06:36,919
شما همچنین می توانید
177
00:06:36,919 –> 00:06:39,020
انتخاب کنید و بنابراین چیز خوب این است که
178
00:06:39,020 –> 00:06:40,280
شما می توانید از
179
00:06:40,280 –> 00:06:40,680
نقاط مختلف یا
180
00:06:40,680 –> 00:06:42,300
خودتان انتخاب کنید و آنها را به نوعی ترکیب کنید،
181
00:06:42,300 –> 00:06:45,060
بنابراین در حالت پایانی برای انتخاب به یاد داشته باشید
182
00:06:45,060 –> 00:06:47,220
که به این معنی است که ما می خواهیم موارد را با هم ترکیب کنیم.
183
00:06:47,220 –> 00:06:48,479
انتخابی که ما به تازگی با مورد قبلی
184
00:06:48,479 –> 00:06:49,830
انجام دادیم، به این معنی که ما فقط
185
00:06:49,830 –> 00:06:51,330
آن نقاط قرمز را انتخاب می کنیم و سپس می توانیم
186
00:06:51,330 –> 00:06:53,970
با
187
00:06:53,970 –> 00:06:56,160
چرخاندن داده ها و انتخاب
188
00:06:56,160 –> 00:06:58,740
از یک دیدگاه متفاوت، به پاکسازی آن انتخاب ادامه دهیم و
189
00:06:58,740 –> 00:07:00,000
البته می دانید که این بخش دارای
190
00:07:00,000 –> 00:07:01,590
به سایر بینندگان منتشر می شود، بنابراین ما
191
00:07:01,590 –> 00:07:04,229
می توانیم برویم و به
192
00:07:04,229 –> 00:07:06,120
نمودارهای پراکندگی دوبعدی نمودارهای پراکنده نگاه کنیم و ببینیم که آن نقاط کجا
193
00:07:06,120 –> 00:07:10,229
هستند نوع دیگری از نمایشگر مفید است که
194
00:07:10,229 –> 00:07:11,520
در واقع فقط یک نمایشگر جدول ساده است،
195
00:07:11,520 –> 00:07:12,690
گاهی اوقات شما فقط می خواهید مقادیر داده ها
196
00:07:12,690 –> 00:07:15,300
را ببینید و نه فقط آنها را رسم کنید. بنابراین ما
197
00:07:15,300 –> 00:07:17,250
یک نمایشگر جدول داریم که می توانید انتخاب
198
00:07:17,250 –> 00:07:19,410
کنید فقط یک زیرمجموعه خاص را نشان دهید که به آن
199
00:07:19,410 –> 00:07:21,599
علاقه دارید، بنابراین اکنون اگر می
200
00:07:21,599 –> 00:07:22,949
خواهید می توانید بروید و می دانید
201
00:07:22,949 –> 00:07:24,270
داده ها را با جزئیات نگاه کنید تا مجبور نباشید
202
00:07:24,270 –> 00:07:27,590
آن را به آن صادر کنید. در واقع به مقادیر خوب نگاه کنید،
203
00:07:27,590 –> 00:07:30,630
بنابراین این فقط یک مجموعه داده منفرد است،
204
00:07:30,630 –> 00:07:32,160
اما قدرت چسب این است که می تواند
205
00:07:32,160 –> 00:07:34,740
چندین مجموعه داده را به هم بچسباند، بنابراین من می
206
00:07:34,740 –> 00:07:36,509
خواهم یک تصویر ماهواره ای از
207
00:07:36,509 –> 00:07:39,240
کره ای از غرب ماساچوست شرقی
208
00:07:39,240 –> 00:07:42,300
باز کنم. اکنون می توانید آن
209
00:07:42,300 –> 00:07:44,639
را دوباره روی بوم بکشید و
210
00:07:44,639 –> 00:07:48,030
یک تصویر دوبعدی را به صورت طرح درآورید، بنابراین نکته خوب در مورد
211
00:07:48,030 –> 00:07:50,070
این نمایشگر تصویر،
212
00:07:50,070 –> 00:07:52,620
داده های دسترسی ضعیف شما است که در واقع واقعاً
213
00:07:52,620 –> 00:07:54,120
مورد نیاز هستند، بنابراین اگر مجموعه داده های بسیار بزرگ
214
00:07:54,120 –> 00:07:55,889
و حافظه خود دارید نقشه برداری از آن به گونه ای که
215
00:07:55,889 –> 00:07:57,330
بدانید در واقع با بارگیری روی داده
216
00:07:57,330 –> 00:07:59,520
، نمایشگر تصویر فقط به بخش
217
00:07:59,520 –> 00:08:01,289
هایی از داده های مورد نیاز دسترسی پیدا می کند و
218
00:08:01,289 –> 00:08:02,280
شما همه نوع ویژگی هایی را
219
00:08:02,280 –> 00:08:03,570
که از یک نمایشگر تصویر انتظار دارید را دارید، بنابراین می توانید
220
00:08:03,570 –> 00:08:05,310
کنتراست را در نقشه رنگی تغییر دهید.
221
00:08:05,310 –> 00:08:08,340
و سوگیری و و همچنین می توانید همانطور که
222
00:08:08,340 –> 00:08:09,539
در یک دقیقه نشان خواهم داد می توانید چندین
223
00:08:09,539 –> 00:08:12,120
تصویر را به طور همزمان نشان دهید، بنابراین این
224
00:08:12,120 –> 00:08:13,789
فرودگاه بوستون با سه باند است
225
00:08:13,789 –> 00:08:16,889
و کاری که اکنون می توانیم انجام دهیم این
226
00:08:16,889 –> 00:08:19,020
است که چسب نمی داند که این
227
00:08:19,020 –> 00:08:20,639
مجموعه داده مربوط به کاتالوگ است، بنابراین ما
228
00:08:20,639 –> 00:08:22,470
این ویرایشگر پیوند را باز می کنیم و می توانید
229
00:08:22,470 –> 00:08:24,810
دو مجموعه داده را ببینید که هنوز به هم مرتبط نیستند و
230
00:08:24,810 –> 00:08:26,280
می توانید انتخاب کنید که کدام ادای احترام برای
231
00:08:26,280 –> 00:08:28,229
پیوند بین داده ها در حال حاضر در این
232
00:08:28,229 –> 00:08:30,180
مورد نوع پیوند هستند. یک لینک
233
00:08:30,180 –> 00:08:31,889
بسیار ساده است گفتن این همان است،
234
00:08:31,889 –> 00:08:34,169
اما در واقع می توانید استفاده کنید و من
235
00:08:34,169 –> 00:08:35,729
این را در یک ثانیه به شما نشان خواهم داد
236
00:08:35,729 –> 00:08:37,469
که تعداد زیادی انواع
237
00:08:37,469 –> 00:08:40,229
پیوندهای دیگر وجود دارد و می توانید انواع پیوندهای غیرخطی خود را تعریف کنید
238
00:08:40,229 –> 00:08:41,909
تا هر
239
00:08:41,909 –> 00:08:43,740
تابع پایتون که برخی از آنها را تبدیل کند. مجموعه ای از
240
00:08:43,740 –> 00:08:45,600
مقادیر به مجموعه ای دیگر از مقادیر، یک
241
00:08:45,600 –> 00:08:47,660
تابع معتبر برای ایجاد پیوند با
242
00:08:47,660 –> 00:08:49,770
آن است، بنابراین اکنون ما
243
00:08:49,770 –> 00:08:51,870
مجموعه های داده را پیوند داده ایم و به راحتی می توانیم داده ها را
244
00:08:51,870 –> 00:08:54,329
از زیر مجموعه قرمز بگیریم و آنها
245
00:08:54,329 –> 00:08:54,580
می دانند
246
00:08:54,580 –> 00:08:56,770
که تصویری را که می دانید حذف می کنند. ببینید
247
00:08:56,770 –> 00:08:59,110
آن نقاط کجا هستند و سپس میدانید
248
00:08:59,110 –> 00:09:00,910
اگر در تجسمهای دیگر انتخابی انجام دهیم،
249
00:09:00,910 –> 00:09:04,330
میدانید که
250
00:09:04,330 –> 00:09:05,710
انتخاب در نمایشگر تصویر اکنون
251
00:09:05,710 –> 00:09:07,450
بهروزرسانی میشود، بنابراین اکنون این همه هواپیماهایی
252
00:09:07,450 –> 00:09:09,610
هستند که دوباره برخی از آنها را
253
00:09:09,610 –> 00:09:10,960
به سمت فرودگاه فرود میآورند. آنها را به سمت
254
00:09:10,960 –> 00:09:13,810
سیب های دیگر می بینید و در واقع می توانید ببینید
255
00:09:13,810 –> 00:09:15,520
که داده هایی که می دانید مسیر هواپیما
256
00:09:15,520 –> 00:09:17,950
در واقع به
257
00:09:17,950 –> 00:09:21,280
خوبی در یک راستا قرار دارند، اما باند فرودگاه ها اکنون به دلیل اینکه رنگ
258
00:09:21,280 –> 00:09:22,750
آبی در پایتون ساخته شده است به این معنی است که ما
259
00:09:22,750 –> 00:09:25,330
یک ترمینال داخلی و یک چیزی که
260
00:09:25,330 –> 00:09:27,610
می بینید می توانید از پایتون نیز با آن تعامل داشته باشید
261
00:09:27,610 –> 00:09:29,980
و بنابراین در این مورد نشان
262
00:09:29,980 –> 00:09:31,510
می دهم که می توانید به اتصال داده ای
263
00:09:31,510 –> 00:09:33,820
که دارای دو مجموعه داده است دسترسی داشته باشید، می توانیم
264
00:09:33,820 –> 00:09:35,440
به جزئیات یکی از مجموعه داده ها
265
00:09:35,440 –> 00:09:38,230
نگاه کنیم و فقط ویژگی ها را در آن ببینیم. دادهها و
266
00:09:38,230 –> 00:09:39,670
سپس میتوانید هر نوع تحلیلی را که
267
00:09:39,670 –> 00:09:41,320
میخواهید انجام دهید، بنابراین من فقط از بند شمارنده استفاده میکنم تا
268
00:09:41,320 –> 00:09:43,870
269
00:09:43,870 –> 00:09:47,200
متداولترین علامت خنک برای هواپیما را پیدا کنم، بنابراین
270
00:09:47,200 –> 00:09:48,490
قسمت سرد مانند شماره پرواز
271
00:09:48,490 –> 00:09:52,000
یا شماره هواپیما باشد و سپس
272
00:09:52,000 –> 00:09:53,740
اساساً به دنبال پنج مورد
273
00:09:53,740 –> 00:09:55,390
متداول هستیم، اولین مورد فقط صفر
274
00:09:55,390 –> 00:09:57,580
صفر است، به این معنی که فقط من فکر میکنم
275
00:09:57,580 –> 00:10:00,010
هیچ کد معتبری وجود ندارد، بنابراین میتوانیم کد
276
00:10:00,010 –> 00:10:01,960
دوم را بگیریم و اکنون میتوانیم یک
277
00:10:01,960 –> 00:10:04,060
زیرمجموعه را به صورت برنامهنویسی بسازیم، بنابراین شما میتوانید
278
00:10:04,060 –> 00:10:07,210
با استفاده از برنامهنویسی یک انتخاب را انجام دهید.
279
00:10:07,210 –> 00:10:09,010
این کد پرواز تا ما بتوانیم
280
00:10:09,010 –> 00:10:11,530
به نکاتی که مخصوصاً برای آن
281
00:10:11,530 –> 00:10:13,150
هواپیما هستند نگاه کنیم، بنابراین
282
00:10:13,150 –> 00:10:15,190
هواپیمایی است که بیشترین امتیاز را دارد و بنابراین
283
00:10:15,190 –> 00:10:16,360
می توانید ببینید منظور من API است که همه
284
00:10:16,360 –> 00:10:18,100
با جزئیات در مستندات توضیح داده شده است.
285
00:10:18,100 –> 00:10:20,620
چگونه می توان این کار را انجام داد، اما اکنون می توانید ببینید
286
00:10:20,620 –> 00:10:22,690
که نقاط در واقع
287
00:10:22,690 –> 00:10:24,100
الگوی جالبی دارند و این به این دلیل است که
288
00:10:24,100 –> 00:10:25,450
در واقع این یک هواپیما نیست، یک
289
00:10:25,450 –> 00:10:27,070
هلیکوپتر است، اگر آن کد پرواز
290
00:10:27,070 –> 00:10:28,420
را جستجو کنید اما آنلاین نیست، آن را پیدا می کنید، بنابراین
291
00:10:28,420 –> 00:10:30,700
فکر می کنم هلیکوپتر و من اساساً منظورم این است
292
00:10:30,700 –> 00:10:32,200
توضیح می دهد که چرا نقاط بسیار زیادی وجود دارد،
293
00:10:32,200 –> 00:10:33,340
زیرا فقط به نوعی
294
00:10:33,340 –> 00:10:36,580
در اطراف شهر شناور می شود، پاسخ این
295
00:10:36,580 –> 00:10:37,960
نکته بسیار بیشتر از هواپیماهایی است که
296
00:10:37,960 –> 00:10:40,900
از فضای امن هوایی عبور می کنند، خوب است، بنابراین این
297
00:10:40,900 –> 00:10:42,580
فقط یک مثال بود این فقط برای این بود که به
298
00:10:42,580 –> 00:10:44,590
شما این احساس را بدهد که می دانید چیست؟ چسب می تواند این کار را انجام دهد
299
00:10:44,590 –> 00:10:46,360
تا بتوانید مجموعه داده های متعددی را بردارید و
300
00:10:46,360 –> 00:10:48,160
آنها را به هم پیوند دهید انتخاب های متعدد
301
00:10:48,160 –> 00:10:49,870
انتخاب ها را با هم ترکیب می کنند
302
00:10:49,870 –> 00:10:53,470
و همه چیز را به صورت برنامه ریزی انجام می دهند بنابراین
303
00:10:53,470 –> 00:10:55,030
304
00:10:55,030 –> 00:10:56,110
اگر قبلاً با چسب آشنایی دارید
305
00:10:56,110 –> 00:10:58,030
به چند مورد اشاره خواهم کرد. ویژگیهایی
306
00:10:58,030 –> 00:11:00,490
که در سال گذشته اضافه کردهایم و به
307
00:11:00,490 –> 00:11:03,310
نظر من بسیار مهم هستند،
308
00:11:03,310 –> 00:11:06,220
اولین مورد این است که بسیاری از مواقع
309
00:11:06,220 –> 00:11:07,870
وقتی در یک دامنه خاص هستید و
310
00:11:07,870 –> 00:11:08,319
311
00:11:08,319 –> 00:11:09,970
دادههای خود را دارید راههای خاصی برای
312
00:11:09,970 –> 00:11:11,669
پیوند دادن دادهها وجود دارد که میتوان
313
00:11:11,669 –> 00:11:14,350
استانداردسازی کرد و شما اساساً میتوانید در یک
314
00:11:14,350 –> 00:11:16,269
تابع پایتون بنویسید که میگوید چگونه
315
00:11:16,269 –> 00:11:18,069
مجموعههای داده را پیوند دهیم، بنابراین ما اکنون
316
00:11:18,069 –> 00:11:20,649
چارچوبی برای انجام این کار برای اساساً
317
00:11:20,649 –> 00:11:23,410
تعریف توابع پیوند خودکار
318
00:11:23,410 –> 00:11:25,299
داریم و آن را پیادهسازی کردهایم. برای برخی از انواع
319
00:11:25,299 –> 00:11:27,309
مجموعه داده ها در حال حاضر و نکته دیگر این است
320
00:11:27,309 –> 00:11:29,499
که در نمایشگر تصویر و در
321
00:11:29,499 –> 00:11:31,209
رندر حجم سه بعدی که من هنوز نشان
322
00:11:31,209 –> 00:11:35,019
نداده ام، اساساً می توانید چندین
323
00:11:35,019 –> 00:11:36,489
مجموعه داده را با هم در شبکه های مختلف نشان دهید،
324
00:11:36,489 –> 00:11:39,100
بنابراین در این مثال من
325
00:11:39,100 –> 00:11:40,419
این فقط یک مثال نجومی است
326
00:11:40,419 –> 00:11:41,799
زیرا تصاویر نجومی
327
00:11:41,799 –> 00:11:44,289
بسیار زیبا هستند و بنابراین پنج
328
00:11:44,289 –> 00:11:45,819
مجموعه داده مختلف را بارگیری می کند و می توانید ببینید که
329
00:11:45,819 –> 00:11:47,649
می گوید من پیوندهایی را بین این مجموعه داده ها شناسایی کرده ام
330
00:11:47,649 –> 00:11:48,789
و می توانید کل
331
00:11:48,789 –> 00:11:50,439
شبکه پیوندها را ببینید. به شما پیشنهاد میدهد تا
332
00:11:50,439 –> 00:11:51,850
بتوانید بروید و اگر میخواهید با جزئیات به
333
00:11:51,850 –> 00:11:53,559
برخی از پیوندها نگاه کنید، میتوانید آنها را
334
00:11:53,559 –> 00:11:55,749
اعمال کنید و کارتان تمام شد، دادهها
335
00:11:55,749 –> 00:11:58,259
اکنون پیوند شدهاند، بنابراین کاری که میتوانید انجام دهید این است که
336
00:11:58,259 –> 00:12:01,989
اساساً مجموعههای داده را بردارید و
337
00:12:01,989 –> 00:12:05,439
می دانم که استوکتون آنها را با هم در
338
00:12:05,439 –> 00:12:08,049
نمایشگر تصویر نشان می دهد، بنابراین من
339
00:12:08,049 –> 00:12:10,239
واقعاً سریع عمل می کنم فقط برای اینکه
340
00:12:10,239 –> 00:12:11,949
اساساً در این مورد یک تصویر تمام رنگی
341
00:12:11,949 –> 00:12:14,470
ایجاد کنم، بنابراین هر تصویر را به
342
00:12:14,470 –> 00:12:15,789
رنگ متفاوتی نسبت می دهم تا
343
00:12:15,789 –> 00:12:18,879
طول موج های مختلف یا رنگ های مختلف و
344
00:12:18,879 –> 00:12:19,989
سپس اساساً چیزی که اتفاق میافتد این است که
345
00:12:19,989 –> 00:12:22,269
در حین حرکت در اطراف،
346
00:12:22,269 –> 00:12:24,579
اساساً این تصاویر
347
00:12:24,579 –> 00:12:26,289
شبکههای متفاوتی ندارند و بنابراین وقتی
348
00:12:26,289 –> 00:12:28,329
در اطراف حرکت میکنید این موضوع به نوعی
349
00:12:28,329 –> 00:12:31,029
در تصاویر به
350
00:12:31,029 –> 00:12:34,089
شبکه پیکسلهای نمایشگر بازتابیده میشود و باز هم
351
00:12:34,089 –> 00:12:35,559
بسیار کارآمد است. اگر
352
00:12:35,559 –> 00:12:37,209
تصاویر بسیار بزرگی دارید، باز هم خوب کار میکند، میدانید که
353
00:12:37,209 –> 00:12:39,699
اگر بخواهید میتوانید این کار را با تصاویر 100 گیگابایتی انجام دهید
354
00:12:39,699 –> 00:12:42,220
و تا زمانی که
355
00:12:42,220 –> 00:12:43,839
آنها بتوانند بروند و فقط به بخشی از دادهها دسترسی داشته باشند، به
356
00:12:43,839 –> 00:12:47,499
357
00:12:47,499 –> 00:12:49,089
ویژگی مهم دیگری نیاز دارد که ما. ما روی آن کار کردهایم این
358
00:12:49,089 –> 00:12:53,199
است که میخواهیم بتوانیم
359
00:12:53,199 –> 00:12:55,299
مجموعههای دادهای بزرگ را پشتیبانی کنیم که
360
00:12:55,299 –> 00:12:56,919
لزوماً محلی نیستند و مجموعههای داده
361
00:12:56,919 –> 00:12:59,019
لزوماً فقط نوعی دادههای شبکهبندی منظم نیستند.
362
00:12:59,019 –> 00:13:02,859
بنابراین، اساساً کاری که
363
00:13:02,859 –> 00:13:05,739
ما انجام دادهایم این است که اساساً یک API
364
00:13:05,739 –> 00:13:07,959
برای اشیاء داده تعریف کردهایم که آنها
365
00:13:07,959 –> 00:13:09,789
باید ارائه کنند تا
366
00:13:09,789 –> 00:13:11,829
بتوانند در چسب استفاده شوند، اما چسب
367
00:13:11,829 –> 00:13:13,419
نیازی به توجه به جزئیات
368
00:13:13,419 –> 00:13:16,059
نحوه دادهها ذخیره میشوند، فقط باید به
369
00:13:16,059 –> 00:13:17,559
شی دادهای نیاز داشته باشد که بتواند به
370
00:13:17,559 –> 00:13:19,389
عنوان مثال یک هیستوگرام هیستوگرام n بعدی
371
00:13:19,389 –> 00:13:22,130
یا آماری مانند
372
00:13:22,130 –> 00:13:24,890
میانگین حداقل و غیره را برگرداند و سپس چسب
373
00:13:24,890 –> 00:13:26,600
میتواند بدون توجه به نحوه
374
00:13:26,600 –> 00:13:29,120
ذخیره دادهها از آن استفاده کند، بنابراین این مثال خاص.
375
00:13:29,120 –> 00:13:31,580
در واقع همین چند روز پیش
376
00:13:31,580 –> 00:13:34,670
روی ec2 چرخیدم که در آن نمونه ای را قرار دادم که این
377
00:13:34,670 –> 00:13:36,800
مجموعه داده تاکسی معروف نیویورک است
378
00:13:36,800 –> 00:13:39,080
که فکر می کنم برای یک سال است، بنابراین
379
00:13:39,080 –> 00:13:42,710
146 میلیون ردیف دارد و من آن را روی یک
380
00:13:42,710 –> 00:13:43,910
نمونه ec2 قرار دادم که خیلی
381
00:13:43,910 –> 00:13:46,550
قدرتمند نیست، اما فقط برای اینکه نشان دهیم که
382
00:13:46,550 –> 00:13:48,890
از راه دور بوده است و سپس
383
00:13:48,890 –> 00:13:50,780
برای انجام رابط کاربری با سرور از روش پیچیدهای به نام vex استفاده میکنیم
384
00:13:50,780 –> 00:13:53,450
و همانطور که به اطراف میگردم،
385
00:13:53,450 –> 00:13:55,520
اساساً در حال محاسبه مجدد هیستوگرام 2 بعدی است،
386
00:13:55,520 –> 00:13:58,010
بنابراین نقشههای چگالی دادهها
387
00:13:58,010 –> 00:13:59,690
و صد F وجود دارد حدود شش میلیون
388
00:13:59,690 –> 00:14:01,820
امتیاز به ازای هر آن، خوب است، خیلی
389
00:14:01,820 –> 00:14:04,640
آهسته نیست و شما همچنین می توانید سپس
390
00:14:04,640 –> 00:14:06,740
در یک ثانیه نشان خواهم داد که انتخاب کنید، می
391
00:14:06,740 –> 00:14:08,510
توانید نمودار سمت راست را ببینید که مسافت سفر را
392
00:14:08,510 –> 00:14:10,070
در مقابل مقدار منصفانه نشان می دهد
393
00:14:10,070 –> 00:14:11,810
و اگر شما
394
00:14:11,810 –> 00:14:13,490
قبل از اینکه در مورد این موضوع بدانید این مجموعه داده را دیدهاید، اما
395
00:14:13,490 –> 00:14:15,500
اساساً این افزایش در دادهها در
396
00:14:15,500 –> 00:14:17,240
وسط وجود دارد که حدود پنجاه و دو دلار است
397
00:14:17,240 –> 00:14:20,030
که فکر میکنم کرایه ثابتی است که
398
00:14:20,030 –> 00:14:23,420
از فرودگاه به منهتن بروید و بنابراین ما میتوانیم آن
399
00:14:23,420 –> 00:14:25,460
را انتخاب کنیم و شما ببینید که
400
00:14:25,460 –> 00:14:27,940
در حال حاضر فرودگاه در معرض دید نیست،
401
00:14:27,940 –> 00:14:30,770
اما در یک ثانیه، بنابراین انتخاب
402
00:14:30,770 –> 00:14:33,020
انجام می شود، اگر سرور از دست رفته باشد، همه چیز در زمان واقعی انجام
403
00:14:33,020 –> 00:14:35,990
می شود تا برگردد، سپس
404
00:14:35,990 –> 00:14:38,240
نقشه هایی را مشاهده کنید که این انتخاب را اعمال می کنند و می توانید
405
00:14:38,240 –> 00:14:40,610
ببینید که همانطور که ما در سراسر صفحه حرکت می کنیم. زیر مجموعه ای
406
00:14:40,610 –> 00:14:41,990
که ما نرمال می کنیم و بیشتر نقاط قرمز
407
00:14:41,990 –> 00:14:43,700
فرودگاه هستند، بنابراین این همان
408
00:14:43,700 –> 00:14:48,260
عرض جغرافیایی غیر دانشجویی است، بنابراین
409
00:14:48,260 –> 00:14:50,690
ایده اینجا این است که بدانید چون آبی
410
00:14:50,690 –> 00:14:52,580
به شما اهمیتی نمی دهد بدانید که داده ها چگونه
411
00:14:52,580 –> 00:14:54,9