در این مطلب، ویدئو یادگیری ماشینی: بردار ویژگی چیست؟ با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:01,770 –> 00:00:04,059
همه و به این کلاس خوش آمدید
2
00:00:04,059 –> 00:00:08,250
پشته numpy در پایتون
3
00:00:11,290 –> 00:00:13,330
در این سخنرانی ما ابتدا در
4
00:00:13,330 –> 00:00:16,720
مورد بردارهای ویژگی صحبت
5
00:00:16,720 –> 00:00:20,080
6
00:00:20,080 –> 00:00:22,210
7
00:00:22,210 –> 00:00:25,270
می کنیم. ما
8
00:00:25,270 –> 00:00:26,890
میدانیم فهرست چیست و فکر میکنم میدانیم
9
00:00:26,890 –> 00:00:28,720
چه اعدادی هستند، بنابراین نیازی به
10
00:00:28,720 –> 00:00:31,570
تفکیک بیشتر آن نیست، اما مهمتر از همه،
11
00:00:31,570 –> 00:00:33,910
ما میتوانیم بردارها را با ترسیم آنها
12
00:00:33,910 –> 00:00:36,730
در صفحه دکارتی
13
00:00:36,730 –> 00:00:38,440
تجسم
14
00:00:38,440 –> 00:00:40,450
کنیم.
15
00:00:40,450 –> 00:00:42,690
مفهوم انتزاعی،
16
00:00:45,770 –> 00:00:47,660
بنابراین اکنون که می دانیم بردار
17
00:00:47,660 –> 00:00:50,390
چیست، بردار ویژگی چیست،
18
00:00:50,390 –> 00:00:52,460
نمونه های زیادی از آن را در
19
00:00:52,460 –> 00:00:55,070
چند سخنرانی اخیر بررسی کرده ایم، یکی از
20
00:00:55,070 –> 00:00:57,020
نمونه های مورد علاقه من پیش بینی
21
00:00:57,020 –> 00:00:59,270
نمره امتحان یک نفر برای انجام این کار است، ما جدولی از
22
00:00:59,270 –> 00:01:02,240
ورودی ها داریم. به یاد داشته باشید که این یک ماتریس N توسط D است
23
00:01:02,240 –> 00:01:04,760
که در آن n تعداد نمونه ها و
24
00:01:04,760 –> 00:01:07,880
D تعداد ویژگی ها است، به عنوان مثال
25
00:01:07,880 –> 00:01:09,740
ما D برابر با 3 در اینجا داریم و
26
00:01:09,740 –> 00:01:11,900
ویژگی های ورودی چند ساعت است که شما
27
00:01:11,900 –> 00:01:14,120
برای امتحان مطالعه کرده اید. ساعتهایی که
28
00:01:14,120 –> 00:01:15,560
در طول دوره امتحان صرف بازیهای ویدیویی کردهاید
29
00:01:15,560 –> 00:01:17,960
و تعداد کلاسهایی که در
30
00:01:17,960 –> 00:01:20,510
این ترم از دست دادهاید، چیزی که میخواهم به آن
31
00:01:20,510 –> 00:01:22,940
توجه داشته باشید این است که هر ردیف از این جدول
32
00:01:22,940 –> 00:01:25,880
بردار ویژگی متفاوتی است، چیزی که
33
00:01:25,880 –> 00:01:27,590
درک این موضوع بسیار مهم است این است
34
00:01:27,590 –> 00:01:29,660
که مهم نیست مجموعه دادهای که به دادههایمان نگاه میکردیم
35
00:01:29,660 –> 00:01:32,630
همیشه به نظر میرسد این X
36
00:01:32,630 –> 00:01:34,790
همیشه یک ماتریس 2 بعدی از شکل n در D
37
00:01:34,790 –> 00:01:37,130
است مهم نیست ویژگیها چیست یا
38
00:01:37,130 –> 00:01:39,619
از چه مجموعه دادهای آمدهاند، بنابراین برای این
39
00:01:39,619 –> 00:01:42,080
مثال خاص،
40
00:01:42,080 –> 00:01:45,860
بردار ویژگی شماره یک دانشآموز 10 3 است. 0 هر
41
00:01:45,860 –> 00:01:48,200
عنصر را ویژگی می نامیم، به
42
00:01:48,200 –> 00:01:50,119
عنوان مثال چند ساعت مطالعه کرده اید
43
00:01:50,119 –> 00:01:52,539
یک ویژگی است،
44
00:01:55,460 –> 00:01:58,250
پس چرا این مهم است،
45
00:01:58,250 –> 00:02:00,200
اما برای مفید بودن یک ویژگی باید
46
00:02:00,200 –> 00:02:02,750
پیش بینی کننده باشد، به این معنی که باید به ما کمک
47
00:02:02,750 –> 00:02:05,390
کند تا متغیر خروجی را به طور مستقیم پیش بینی
48
00:02:05,390 –> 00:02:08,000
کنیم. بدانید که نمره امتحان شما احتمالاً
49
00:02:08,000 –> 00:02:11,090
به میزان مطالعه شما بستگی دارد، اما
50
00:02:11,090 –> 00:02:13,100
بدیهی است که اگر بخواهم نمره شما را
51
00:02:13,100 –> 00:02:15,770
در امتحان بر اساس قد شما پیش بینی کنم، احتمالاً قد شما
52
00:02:15,770 –> 00:02:17,660
خیلی زیاد نمی شود، احتمالاً فایده ای ندارد.
53
00:02:17,660 –> 00:02:19,790
ویژگی کامل
54
00:02:19,790 –> 00:02:20,950
برای این مشکل
55
00:02:20,950 –> 00:02:24,040
[موسیقی]
56
00:02:25,890 –> 00:02:28,290
بنابراین بسیاری از مردم در دنیای واقعی از من می پرسند که
57
00:02:28,290 –> 00:02:30,330
چگونه می توانم ویژگی های خوبی داشته باشم
58
00:02:30,330 –> 00:02:32,820
و روش های مختلفی وجود
59
00:02:32,820 –> 00:02:34,710
دارد که می توانید یکی از آنها
60
00:02:34,710 –> 00:02:37,110
لزوما بهتر از دیگری نیست، اما
61
00:02:37,110 –> 00:02:38,610
خوب است بدانید چه رویکردهایی در
62
00:02:38,610 –> 00:02:40,830
دسترس شما هستند، بنابراین بدانید وقتی روی پروژه یادگیری ماشینی خود کار می کنید چه چیزی را امتحان کنید
63
00:02:40,830 –> 00:02:42,390
64
00:02:42,390 –> 00:02:44,790
، اولین مورد بسیار
65
00:02:44,790 –> 00:02:46,590
ساده است و آنچه که اکثر مردم
66
00:02:46,590 –> 00:02:49,050
با استفاده از دانش دامنه شما بدیهی در نظر می گیرند،
67
00:02:49,050 –> 00:02:52,560
به عنوان مثال یک متخصص در
68
00:02:52,560 –> 00:02:54,750
آناتومی می خواهد انجام دهد.
69
00:02:54,750 –> 00:02:57,090
برای مجموعه دادههای بیولوژیکی ویژگیهای بهتری نسبت به
70
00:02:57,090 –> 00:02:59,760
گفتن یک حسابدار ارائه میکنم. من فرض
71
00:02:59,760 –> 00:03:01,050
میکنم حسابداران آنقدر از زیستشناسی نمیدانند،
72
00:03:01,050 –> 00:03:03,570
اما در هر صورت ممکن است اشتباه کنم
73
00:03:03,570 –> 00:03:06,150
، فرض کنیم این موضوع اکنون درست است،
74
00:03:06,150 –> 00:03:07,980
از طرف دیگر احتمالاً یک حسابدار میتواند
75
00:03:07,980 –> 00:03:09,510
بیاید. با داشتن ویژگی های بهتر برای
76
00:03:09,510 –> 00:03:12,090
مجموعه داده های مالی، پس از آن یک زیست شناس می تواند
77
00:03:12,090 –> 00:03:15,090
این کار را انجام دهد زیرا هر فرد
78
00:03:15,090 –> 00:03:18,270
در زمینه های مربوطه خود متخصص است و
79
00:03:18,270 –> 00:03:20,250
همه ما در رفتن به مدرسه و
80
00:03:20,250 –> 00:03:23,130
شرکت در امتحانات متخصص هستیم، بنابراین می دانیم که شخص
81
00:03:23,130 –> 00:03:25,200
قد n واقعاً بر میزان موفقیت
82
00:03:25,200 –> 00:03:27,390
شما در امتحان تأثیر نمیگذارد، در حالی که میزان
83
00:03:27,390 –> 00:03:30,290
مطالعه
84
00:03:33,360 –> 00:03