در این مطلب، ویدئو تشخیص و حذف نقاط پرت با استفاده از IQR | آموزش مهندسی ویژگی پایتون شماره 4 با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:08:02
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,089 –> 00:00:02,399
در این آموزش ما
2
00:00:02,399 –> 00:00:06,720
طبق معمول با استفاده از تکنیک IQR نقاط پرت را حذف
3
00:00:06,720 –> 00:00:08,490
خواهیم کرد، ابتدا به بررسی برخی از تئوری ها می
4
00:00:08,490 –> 00:00:10,889
پردازیم سپس کدهایی را در پانداهای پایتون می نویسیم تا
5
00:00:10,889 –> 00:00:13,110
نقاط پرت را حذف کنیم و در
6
00:00:13,110 –> 00:00:14,969
پایان تمرین جالبی را برای شما
7
00:00:14,969 –> 00:00:18,539
در اینجا حل خواهیم کرد. من یک پایگاه داده ارتفاع دارم در حال حاضر
8
00:00:18,539 –> 00:00:20,970
معاینه بصری شما به راحتی می توانید بگویید
9
00:00:20,970 –> 00:00:23,160
که برخی از نقاط دور افتاده در اینجا وجود دارد که این
10
00:00:23,160 –> 00:00:26,970
ارتفاعات در پا هستند، البته شما نمی
11
00:00:26,970 –> 00:00:29,279
توانید فردی با قد 40 فوت داشته باشید، بنابراین
12
00:00:29,279 –> 00:00:31,230
همه اینها پرت هستند شما
13
00:00:31,230 –> 00:00:34,440
چیزی بیشتر از 77 نقطه 1 را به طور مشابه می دانید.
14
00:00:34,440 –> 00:00:37,260
این یک مجموعه داده عادل است، بنابراین یک نقطه
15
00:00:37,260 –> 00:00:39,989
به ارتفاع، واضح است که این دو ارتفاع
16
00:00:39,989 –> 00:00:42,840
پرت هستند، اکنون چگونه می توانید
17
00:00:42,840 –> 00:00:45,899
با استفاده از تکنیک IQR یک چیز را تشخیص دهید
18
00:00:45,899 –> 00:00:47,820
تا درک IQR داشته باشید، ابتدا باید
19
00:00:47,820 –> 00:00:50,309
صدک را درک کنید، اکنون صدک
20
00:00:50,309 –> 00:00:51,180
21
00:00:51,180 –> 00:00:55,620
صدک چاه اساساً برای چیست؟ به عنوان مثال
22
00:00:55,620 –> 00:00:59,219
در اینجا من این فایل پنج نقطه سه را دارم
23
00:00:59,219 –> 00:01:02,160
که صدک 25 است که به آن q1 نیز می گویند
24
00:01:02,160 –> 00:01:06,720
مقدار صدک 25 یعنی
25
00:01:06,720 –> 00:01:11,010
در مجموعه داده های شما 25 درصد نمونه ها زیر
26
00:01:11,010 –> 00:01:14,750
این مقدار کل نمونه ها هستند. در اینجا بیست و
27
00:01:14,750 –> 00:01:17,790
بیست و پنج درصد از بیست پنج است
28
00:01:17,790 –> 00:01:21,840
و پنج نمونه در اینجا دارای ارزش
29
00:01:21,840 –> 00:01:23,400
کمتر از پنج نقطه سه پنج
30
00:01:23,400 –> 00:01:26,040
هستند.
31
00:01:26,040 –> 00:01:29,460
32
00:01:29,460 –> 00:01:30,619
33
00:01:30,619 –> 00:01:34,229
34
00:01:34,229 –> 00:01:37,729
که شش نقطه بیست و هفت است بنابراین
35
00:01:37,729 –> 00:01:42,180
75 درصد نمونه ها دارای ارزش کمتر
36
00:01:42,180 –> 00:01:44,939
از شش نقطه دو هفت هستند امیدوارم
37
00:01:44,939 –> 00:01:48,360
آن را بدست آورید به همین دلیل است که شش نقطه دو هفت
38
00:01:48,360 –> 00:01:53,070
صدک 75 نامیده می شود حداکثر
39
00:01:53,070 –> 00:01:54,570
مقدار شما صدک صدم نامیده می شود
40
00:01:54,570 –> 00:01:57,030
زیرا البته همه
41
00:01:57,030 –> 00:01:59,280
مقادیر پایین تر از آن مقدار هستند، به طور مشابه،
42
00:01:59,280 –> 00:02:01,409
حداقل مقدار صدک صفر نامیده می شود،
43
00:02:01,409 –> 00:02:03,990
زیرا هیچ
44
00:02:03,990 –> 00:02:06,899
مقداری کمتر از آن مقدار خاص ندارد،
45
00:02:06,899 –> 00:02:09,538
بنابراین این یک خلاصه سریع از
46
00:02:09,538 –> 00:02:12,450
صدک است، اکنون وقتی صدک را شناختید،
47
00:02:12,450 –> 00:02:14,040
می توانید به راحتی
48
00:02:14,040 –> 00:02:20,370
با فرو بردن q3 و q1 در اینجا IQR را محاسبه کنید.
49
00:02:20,370 –> 00:02:24,980
q3 که صدک 75 است 6.27 –
50
00:02:24,980 –> 00:02:28,859
5.35 است q1 نقطه 9 تا 5
51
00:02:28,859 –> 00:02:32,069
مقدار IQR شما است اکنون برای حذف موارد پرت
52
00:02:32,069 –> 00:02:34,109
باید حد پایین و بالایی
53
00:02:34,109 –> 00:02:38,069
حد پایینی خود را ایجاد کنید. این q1 خواهد بود
54
00:02:38,069 –> 00:02:42,420
که صدک 25 است – یک نقطه پنج
55
00:02:42,420 –> 00:02:45,030
IQR اکنون اگر فکر کنید فقط
56
00:02:45,030 –> 00:02:47,549
اگر این فاصله باشد می دانید که
57
00:02:47,549 –> 00:02:50,220
این فاصله است بنابراین شما آن فاصله را
58
00:02:50,220 –> 00:02:52,739
ضرب در 1 نقطه 5 می کنید بنابراین 1/2 را اضافه می کنید.
59
00:02:52,739 –> 00:02:56,129
سپس آن را از اینجا گسترش می
60
00:02:56,129 –> 00:03:00,090
دهید، بنابراین از 5 نقطه 35 منهای 1 امتیاز 5
61
00:03:00,090 –> 00:03:04,379
و این مقدار 3.96 را به دست می آورید به طور مشابه
62
00:03:04,379 –> 00:03:09,090
حد بالایی q3 به علاوه 1.5 IQR خواهد بود، می
63
00:03:09,090 –> 00:03:10,680
دانید که آنها به تازگی به این عدد رسیده اند،
64
00:03:10,680 –> 00:03:12,989
فقط می توانید این را که دارید به خاطر بسپارید.
65
00:03:12,989 –> 00:03:16,980
برای انجام 1.5 IQR به اضافه q3 برای به دست آوردن حد بالای خود،
66
00:03:16,980 –> 00:03:20,579
هنگامی که حد بالا و پایین را
67
00:03:20,579 –> 00:03:23,940
شناختید، می توانید تمام
68
00:03:23,940 –> 00:03:25,859
نقاط داده را که دارای ارزش کمتر از حد پایینی
69
00:03:25,859 –> 00:03:30,180
هستند را حذف کنید، بنابراین 3.96 ببینید این دو در آنجا مستثنی شده اند
70
00:03:30,180 –> 00:03:32,310
، آنها به عنوان نقطه پرت نامیده می شوند و
71
00:03:32,310 –> 00:03:36,359
هر مقدار یک حد بالای کمان که 7
72
00:03:36,359 –> 00:03:39,569
امتیاز 66 است را نیز می توان حذف کرد، بنابراین شما
73
00:03:39,569 –> 00:03:41,519
به وضوح می توانید ببینید که این دو سه
74
00:03:41,519 –> 00:03:43,739
مقدار اکنون حذف شده اند، بنابراین فقط با نگاه
75
00:03:43,739 –> 00:03:46,500
بصری به این مجموعه داده می توانید به
76
00:03:46,500 –> 00:03:49,260
نوعی بگویید که IQR در این مورد خوب عمل می کند.
77
00:03:49,260 –> 00:03:50,909
زیرا اکثر مردم این کار را
78
00:03:50,909 –> 00:03:54,299
خواهند کرد داشتن قد در این محدوده بزرگسالان
79
00:03:54,299 –> 00:03:56,250
دارای قد دو نقطه سه فوت
80
00:03:56,250 –> 00:03:59,60