در این مطلب، ویدئو Google Cloud Text-to-Speech AI API در پایتون – ایجاد برنامه پایتون (قسمت 2) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:25:57
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:02,630 –> 00:00:05,910
[موسیقی]
2
00:00:06,319 –> 00:00:08,320
سلام، بچه ها چطور پیش می رود،
3
00:00:08,320 –> 00:00:10,960
بنابراین از آخرین ویدیو، برخی
4
00:00:10,960 –> 00:00:12,400
از اطلاعات مهم
5
00:00:12,400 –> 00:00:15,599
در مورد Google cloud text to speaking api را
6
00:00:15,599 –> 00:00:18,000
در این ویدیو پوشش می دهم، از
7
00:00:18,000 –> 00:00:18,880
Google cloud
8
00:00:18,880 –> 00:00:21,359
text to speak api استفاده می کنیم و می خواهیم یک Api
9
00:00:21,359 –> 00:00:23,199
ایجاد کنیم. برنامه در پایتون
10
00:00:23,199 –> 00:00:26,480
بسیار خوب است، بنابراین دستور کار اینجاست و
11
00:00:26,480 –> 00:00:28,320
اینها کارهایی است که ما در این تمرین انجام خواهیم داد
12
00:00:28,320 –> 00:00:29,760
،
13
00:00:29,760 –> 00:00:32,238
بنابراین در این ویدیو شما را به نحوه
14
00:00:32,238 –> 00:00:34,160
فعال کردن سرویس api متن به گفتار گوگل راهنمایی می
15
00:00:34,160 –> 00:00:37,280
کنم، من از نحوه
16
00:00:37,280 –> 00:00:39,360
ایجاد یک پروژه google cloud از آنجایی که من
17
00:00:39,360 –> 00:00:40,480
قبلاً یک ویدیو
18
00:00:40,480 –> 00:00:42,559
دارم که به شما نشان می دهد چگونه یک
19
00:00:42,559 –> 00:00:45,200
پروژه جدید گوگل ابری را از ابتدا
20
00:00:45,200 –> 00:00:48,000
ایجاد کنید و ما یک حساب خدمات ایجاد خواهیم کرد بنابراین یک حساب خدمات
21
00:00:48,000 –> 00:00:48,960
22
00:00:48,960 –> 00:00:51,760
در پروژه ابری گوگل یک نوع حساب خاص است
23
00:00:51,760 –> 00:00:53,440
24
00:00:53,440 –> 00:00:55,520
و این حساب در نظر گرفته شده است
25
00:00:55,520 –> 00:00:58,399
نشان دهنده یک کاربر غیر انسانی است که نیاز به
26
00:00:58,399 –> 00:01:00,559
احراز هویت و مجوز دسترسی به
27
00:01:00,559 –> 00:01:03,760
آنها در google apis دارد
28
00:01:03,760 –> 00:01:05,760
و همچنین
29
00:01:05,760 –> 00:01:08,000
فایل سرویس گیرنده حساب کاربری را که قرار است
30
00:01:08,000 –> 00:01:09,840
با فرمت json باشد دانلود می
31
00:01:09,840 –> 00:01:11,600
کنیم سپس یک محیط فیلتر پایتون
32
00:01:11,600 –> 00:01:13,439
برای این پروژه ایجاد می کنیم.
33
00:01:13,439 –> 00:01:15,119
en ما محیط را فعال می
34
00:01:15,119 –> 00:01:18,000
کنیم تا کتابخانه کلاینت متن به گفتار پایتون را نصب کنیم
35
00:01:18,000 –> 00:01:19,360
36
00:01:19,360 –> 00:01:22,000
و به دنبال آن مستندات api متن به گفتار را مرور می
37
00:01:22,000 –> 00:01:24,240
38
00:01:24,240 –> 00:01:26,479
کنیم و در نهایت یک اسکریپت پایتون ایجاد می کنیم
39
00:01:26,479 –> 00:01:28,720
تا نحوه استفاده از api متن به گفتار را بیاموزیم.
40
00:01:28,720 –> 00:01:30,159
41
00:01:30,159 –> 00:01:31,920
بسیار خوب، پس بیایید با آیتم
42
00:01:31,920 –> 00:01:33,759
شماره یک شروع کنیم که
43
00:01:33,759 –> 00:01:38,240
سرویس api تبدیل متن به گفتار را فعال می کند،
44
00:01:38,240 –> 00:01:41,880
بنابراین کاری که می خواهم انجام دهم این است که می خواهم به console.cloud.google.com بروم
45
00:01:41,880 –> 00:01:43,360
46
00:01:43,360 –> 00:01:45,439
و این شما را به صفحه داشبورد uh می برد.
47
00:01:45,439 –> 00:01:46,880
48
00:01:46,880 –> 00:01:49,040
اگر در پلتفرم ابری گوگل تازه
49
00:01:49,040 –> 00:01:50,720
کار هستید، توصیه می کنم ابتدا یک
50
00:01:50,720 –> 00:01:51,840
حساب کاربری جدید بسازید،
51
00:01:51,840 –> 00:01:54,560
سپس یک پروژه جدید بسازید، متأسفانه
52
00:01:54,560 –> 00:01:56,320
گوگل این فرآیند را
53
00:01:56,320 –> 00:01:58,719
بر خلاف برخی
54
00:01:58,719 –> 00:02:01,360
از سرویس های دیگر مانند مایکروسافت آژور
55
00:02:01,360 –> 00:02:03,280
که کمی زمان می برد تا
56
00:02:03,280 –> 00:02:05,119
نحوه تنظیم را یاد بگیرم، بسیار ساده است. به درستی بالا بروید
57
00:02:05,119 –> 00:02:07,040
و هنگامی که یک پروژه ایجاد کردید، بنابراین در اینجا
58
00:02:07,040 –> 00:02:09,280
من می خواهم پروژه خود را در پروژه خود انتخاب
59
00:02:09,280 –> 00:02:10,878
کنم، این
60
00:02:10,878 –> 00:02:13,200
نسخه دموی google cloud خواهد بود،
61
00:02:13,200 –> 00:02:16,239
پروژه ای را که می خواهم از آن استفاده کنم را انتخاب می کنم.
62
00:02:16,800 –> 00:02:18,560
63
00:02:18,560 –> 00:02:20,160
64
00:02:20,160 –> 00:02:25,599
خدمات و کلیک کنید در کتابخانه
65
00:02:27,440 –> 00:02:29,840
و اگر میخواهید سرویسی را
66
00:02:29,840 –> 00:02:31,040
که
67
00:02:31,040 –> 00:02:35,120
میخواهم استفاده کنم فعال کنید، متن به گفتار خواهد بود
68
00:02:35,519 –> 00:02:38,080
و در اینجا سه نتیجه داریم که میخواهیم api
69
00:02:38,080 –> 00:02:39,519
70
00:02:39,519 –> 00:02:43,120
بری متن به گفتار را انتخاب کنیم و ف
71
00:02:44,879 –> 00:02:46,560
ط مطمئن شوید که api متن به گف
72
00:02:46,560 –> 00:02:49,360
ار ابری است. اکنون فعال است،
73
00:02:49,360 –> 00:02:52,959
اجازه دهید به داشبورد
74
00:02:56,720 –> 00:02:59,120
برگردیم، بنابراین ما سرویس متن به گفتار Google را فعال کرده ایم،
75
00:02:59,120 –> 00:03:00,239
76
00:03:00,239 –> 00:03:04,959
اکنون باید یک حساب کاربری ایجاد کنیم،
77
00:03:04,959 –> 00:03:08,080
بنابراین دوباره به منوی ناوبری
78
00:03:08,080 –> 00:03:10,800
apis and services برگردید و روی
79
00:03:10,800 –> 00:03:13,519
اعتبارنامه ها
80
00:03:14,879 –> 00:03:16,840
در بالای صفحه کلیک کنید که می خواهید روی ایجاد کلیک کنید.
81
00:03:16,840 –> 00:03:18,640
credentials
82
00:03:18,640 –> 00:03:20,400
و ما سه نوع مختلف از
83
00:03:20,400 –> 00:03:22,080
credentials api key
84
00:03:22,080 –> 00:03:25,120
از شناسه مشتری و حساب سرویس داریم و
85
00:03:25,120 –> 00:03:28,480
حساب سرویس را انتخاب
86
00:03:28,720 –> 00:03:30,720
می کنیم و در اینجا باید نام حساب سرویس خود را بدهیم،
87
00:03:30,720 –> 00:03:33,120
من قصد دارم این
88
00:03:33,120 –> 00:03:36,480
نسخه آزمایشی را متن به گفتار فراخوانی
89
00:03:36,480 –> 00:03:39,680
کنیم، همچنین می توانیم توضیحات را برای توضیح وارد کنیم
90
00:03:39,680 –> 00:03:42,799
اکانت برای چه چیزی استفاده می شود
91
00:03:42,799 –> 00:03:46,640
و سپس روی ایجاد
92
00:03:46,640 –> 00:03:48,959
اکنون یک حساب سرویس ایجاد می شود کلیک
93
00:03:48,959 –> 00:03:52,159
کنید تا به پایان برسد
94
00:03:54,239 –> 00:03:56,400
اکنون باید
95
00:03:56,400 –> 00:03:58,239
فایل سرویس گیرنده حساب کاربری را دانلود کنیم
96
00:03:58,239 –> 00:03:59,920
و متأسفانه نمی توانید فقط کلیک کنید
97
00:03:59,920 –> 00:04:02,080
k در این حساب
98
00:04:02,080 –> 00:04:03,680
و هیچ گزینه ای برای دانلود فایل مشتری برای شما وجود ندارد
99
00:04:03,680 –> 00:04:06,319
100
00:04:06,319 –> 00:04:09,920
و اگر روی این آیتم اضافه
101
00:04:09,920 –> 00:04:11,599
شده در بالا کلیک کنید، فقط به شما این امکان را می دهد که
102
00:04:11,599 –> 00:04:14,799
یک کلید جدید اضافه کنید یا
103
00:04:14,799 –> 00:04:17,279
مجوز را تغییر دهید، اجازه دهید به
104
00:04:17,279 –> 00:04:19,759
منوی ناوبری
105
00:04:19,759 –> 00:04:22,800
که می خواهید برگردیم. برای کلیک بر روی من مدیر هستم
106
00:04:22,800 –> 00:04:28,000
و روی حسابهای سرویس کلیک کنید
107
00:04:28,000 –> 00:04:30,000
، میخواهم فایل کلاینت را برای
108
00:04:30,000 –> 00:04:31,600
متن نمایشی به گفتار دانلود کنم
109
00:04:31,600 –> 00:04:34,320
تا دقیقاً در اینجا زیر ستون اقدامات،
110
00:04:34,320 –> 00:04:36,160
111
00:04:36,160 –> 00:04:39,759
روی ایجاد کلید کلیک کنید، من
112
00:04:39,759 –> 00:04:44,080
json را به عنوان نوع کلید خود انتخاب میکنم و روی ایجاد کلیک میکنم.
113
00:04:44,080 –> 00:04:46,400
و پنجره پاپ آپی ظاهر می شود
114
00:04:46,400 –> 00:04:49,280
که من این فایل
115
00:04:49,280 –> 00:04:51,520
را ذخیره می کنم و این فایل را در پوشه پروژه خود
116
00:04:51,520 –> 00:04:52,800
117
00:04:52,800 –> 00:04:54,720
ذخیره می کنم و فقط آن را در پوشه متن به
118
00:04:54,720 –> 00:04:57,840
گفتار خود ذخیره
119
00:04:58,240 –> 00:05:01,120
120
00:05:05,039 –> 00:05:08,960
می کنم. این حساب سرویس آزمایشی
121
00:05:08,960 –> 00:05:11,840
122
00:05:12,400 –> 00:05:14,880
خیلی خوب است، بنابراین اینجا
123
00:05:14,880 –> 00:05:17,680
فایل مشتری حساب سرویس
124
00:05:18,320 –> 00:05:21,360
من است، اکنون میتوانم آن را ببندم،
125
00:05:21,440 –> 00:05:24,560
پس کجا هستیم، بنابراین میخواهیم
126
00:05:24,560 –> 00:05:26,160
127
00:05:26,160 –> 00:05:29,199
یک محیط مجازی پایتون ایجاد کنیم،
128
00:05:29,199 –> 00:05:32,320
بنابراین اجازه دهید این کار را انجام دهم، بنابراین اجازه دهید
129
00:05:32,320 –> 00:05:36,320
محیط مجازی خود را در پایتون خود ایجاد کنم پوشه vmv
130
00:05:36,320 –> 00:05:37,120
131
00:05:37,120 –> 00:05:40,880
بنابراین من می خواهم یک دستور w را باز کنم indow
132
00:05:41,600 –> 00:05:44,639
اجازه دهید یک مورد جدید را باز کنم
133
00:05:47,039 –> 00:05:50,840
اجازه دهید آن درخت را به
134
00:05:50,840 –> 00:05:55,680
اوپس تغییر دهم، اجازه دهید dr2 را به
135
00:05:55,680 –> 00:05:59,680
پنجره vmv پایتون تغییر دهم اوه
136
00:05:59,680 –> 00:06:03,440
اوه باید درایو مشکلی نداشته باشد
137
00:06:03,440 –> 00:06:06,240
تا یک محیط مجازی پایتون ایزوله ایجاد
138
00:06:06,240 –> 00:06:07,120
شود،
139
00:06:07,120 –> 00:06:10,880
بنابراین از خط تیره پایتون commit m
140
00:06:10,880 –> 00:06:14,000
vmv استفاده کنیم. و من می دانم که بسیاری از مردم دوست دارند
141
00:06:14,000 –> 00:06:14,560
از
142
00:06:14,560 –> 00:06:18,400
نام vemv برای محیط مجازی پایتون استفاده کنند،
143
00:06:18,400 –> 00:06:21,919
من قصد دارم پروژه خود
144
00:06:21,919 –> 00:06:26,319
را به صورت نمایشی متن به گفتار google نام ببرم
145
00:06:27,440 –> 00:06:30,319
و یک پوشه پروژه جدید ایجاد خواهم کرد، بنابراین همین
146
00:06:30,319 –> 00:06:32,560
147
00:06:32,560 –> 00:06:35,360
حالا اجازه دهید فایل ها را به اینجا منتقل کنم. از
148
00:06:35,360 –> 00:06:36,080
149
00:06:36,080 –> 00:06:39,039
فایل های پروژه،
150
00:06:41,600 –> 00:06:49,840
بنابراین فایل سرویس گیرنده حساب کاربری من را منتقل کنید
151
00:06:50,479 –> 00:06:52,800
و من از کد vs برای این تمرین استفاده
152
00:06:52,800 –> 00:06:56,319
خواهم کرد، بنابراین من می خواهم کد vs را باز کنم و
153
00:06:56,639 –> 00:06:59,919
اکنون یک فایل جدید ایجاد کنم و من فقط نام
154
00:06:59,919 –> 00:07:01,039
این فایل
155
00:07:01,039 –> 00:07:03,520
را در بالا
156
00:07:07,039 –> 00:07:08,960
در حال حاضر محیط من است. با اشاره به
157
00:07:08,960 –> 00:07:10,240
pi qd5،
158
00:07:10,240 –> 00:07:13,680
بنابراین میخواهم آن را به محیط جدید تغییر دهم،
159
00:07:13,680 –> 00:07:19,199
بنابراین مفسر را انتخاب کنید
160
00:07:19,199 –> 00:07:22,080
و برای انتخاب نسخه نمایشی متن به گفتار گوگل،
161
00:07:22,080 –> 00:07:24,479
162
00:07:24,960 –> 00:07:28,080
اکنون ترمینال شما را نشان میدهد
163
00:07:28,080 –> 00:07:30,720
و به طور پیشفرض در مقابل کد، به
164
00:07:30,720 –> 00:07:32,080
طور خودکار
165
00:07:32,080 –> 00:07:35,759
این محیط را تشخیص میدهد، بنابراین ما داریم
166
00:07:35,759 –> 00:07:36,160
167
00:07:36,160 –> 00:07:40,000
مورد یک دو و تی انجام شد hree point 1
168
00:07:40,000 –> 00:07:43,360
اکنون باید uh 3.2 را
169
00:07:43,360 –> 00:07:46,160
درست انجام دهیم، بنابراین اجازه دهید ابتدا اسناد را مرور کنیم
170
00:07:46,160 –> 00:07:48,479
171
00:07:50,479 –> 00:07:53,039
اینجا نقطه صفحه مستندسازی در
172
00:07:53,039 –> 00:07:54,960
کتابخانه های مشتری
173
00:07:54,960 –> 00:07:57,120
در زیر نصب کتابخانه مشتری است
174
00:07:57,120 –> 00:07:58,000
که می خواهیم پایتون را انتخاب
175
00:07:58,000 –> 00:08:00,960
کنیم سپس این
176
00:08:00,960 –> 00:08:03,759
دستور نصب pip
177
00:08:04,400 –> 00:08:06,479
را کپی می کنیم. بازگشت به کد در مقابل من فقط می خواهم
178
00:08:06,479 –> 00:08:07,599
کپی و جایگذاری کنم
179
00:08:07,599 –> 00:08:10,840
و سپس کتابخانه کلاینت گفتار متن را نصب کنم و پس از نصب
180
00:08:10,840 –> 00:08:13,840
کتابخانه
181
00:08:18,080 –> 00:08:19,759
کلاینت تبدیل متن به گفتار
182
00:08:19,759 –> 00:08:21,360
،
183
00:08:21,360 –> 00:08:23,440
اکنون می توانید رسماً از api برای
184
00:08:23,440 –> 00:08:24,960
توسعه خود استفاده کنید
185
00:08:24,960 –> 00:08:27,039
و قبل از انجام این کار، اجازه دهید برویم. در بالای
186
00:08:27,039 –> 00:08:28,080
مستندات
187
00:08:28,080 –> 00:08:30,400
188
00:08:31,840 –> 00:08:35,039
ابتدا دستور نصب pip آمده است و
189
00:08:35,039 –> 00:08:35,679
در اینجا
190
00:08:35,679 –> 00:08:38,719
نحوه شروع احراز هویت شما آمده است
191
00:08:38,719 –> 00:08:41,039
و چون من از ویندوز استفاده می کنم
192
00:08:41,039 –> 00:08:41,839
193
00:08:41,839 –> 00:08:44,880
، دستورالعمل های مربوط به ویندوز را دنبال می کنم
194
00:08:44,880 –> 00:08:46,720
و از دستورالعمل گوگل
195
00:08:46,720 –> 00:08:48,480
توصیه می کند که
196
00:08:48,480 –> 00:08:50,399
محیط قابل مشاهده ایجاد کنید و فایل json مشتری را اختصاص دهید.
197
00:08:50,399 –> 00:08:53,360
مسیر رسیدن به آن متغیر
198
00:08:53,360 –> 00:08:56,160
من قصد دارم از یک رویکرد متفاوت استفاده کنم،
199
00:08:56,160 –> 00:08:58,080
می خواهم محیط خود را در اسکریپت پایتون خود ایجاد کنم
200
00:08:58,080 –> 00:09:01,200
201
00:09:01,279 –> 00:09:04,480
و در اینجا مثالی در مورد نحوه استفاده از
202
00:09:04,480 –> 00:09:07,680
te آورده شده است. xt to speech api بنابراین میخواهم به
203
00:09:07,680 –> 00:09:08,720
چیزی اشاره کنم که
204
00:09:08,720 –> 00:09:12,399
از این مثال، مستندات
205
00:09:12,399 –> 00:09:15,040
از ماژول تبدیل متن به گفتار استفاده میکند،
206
00:09:15,040 –> 00:09:17,760
اگر به سمت چپ برویم و مرجع استراحت را
207
00:09:17,760 –> 00:09:19,760
208
00:09:19,760 –> 00:09:22,959
در اینجا گسترش دهیم، یک v1 و v1b.one داریم
209
00:09:22,959 –> 00:09:25,440
و این در واقع درست است. کتابخانهای
210
00:09:25,440 –> 00:09:26,720
که باید از آن استفاده کنید
211
00:09:26,720 –> 00:09:29,519
، متوجه شدم که ماژول تبدیل متن به گفتار
212
00:09:29,519 –> 00:09:30,640
213
00:09:30,640 –> 00:09:34,959
بهروز نیست، زیرا این نسخه v1 به
214
00:09:34,959 –> 00:09:36,560
این معنی است که ما به مرجع این ماژول v1 نگاه میکنیم،
215
00:09:36,560 –> 00:09:40,000
216
00:09:40,000 –> 00:09:41,519
بنابراین اساساً شما دو کلاس مختلف دارید،
217
00:09:41,519 –> 00:09:43,200
218
00:09:43,200 –> 00:09:46,480
یکی متن است. یکی دیگر
219
00:09:46,480 –> 00:09:49,600
صداها است و منبع متن منبعی
220
00:09:49,600 –> 00:09:53,519
است که در درجه اول بر روی آن تمرکز می کند
221
00:09:53,519 –> 00:09:57,760
و منبع صداها به
222
00:09:57,760 –> 00:10:01,519
سادگی وارد اسناد می
223
00:10:02,000 –> 00:10:04,560
شویم که به سادگی لیستی از اطلاعات مهم یا مفید را در اختیار شما قرار می دهیم که
224
00:10:04,560 –> 00:10:07,200
225
00:10:07,200 –> 00:10:09,519
در این مورد لیستی از اطلاعات خواهد بود. صداهایی
226
00:10:09,519 –> 00:10:11,519
که می توانید از
227
00:10:11,519 –> 00:10:14,399
آنها استفاده کنید، لیست صداها و
228
00:10:14,399 –> 00:10:15,440
229
00:10:15,440 –> 00:10:20,000
انواع اساساً مقادیر انیمیشن متفاوتی دارند،
230
00:10:20,000 –> 00:10:22,880
بنابراین ما صدای مردی زن و
231
00:10:22,880 –> 00:10:24,800
خنثی داریم
232
00:10:24,800 –> 00:10:27,920
حالا بیایید به این منبع متنی
233
00:10:27,920 –> 00:10:33,839
برویم، من می خواهم به سمت ترکیب مرجع درست بروم،
234
00:10:34,640 –> 00:10:37,920
بنابراین این برنامه استفاده
235
00:10:37,920 –> 00:10:40,560
از من از بدنه درخواست بسیار آسان است، ما ورودی
236
00:10:40,560 –> 00:10:40,959
و
237
00:10:40,959 –> 00:10:42,959
صدایی داریم که میخواهم از آن استفاده کنم و پیکربندی صدا،
238
00:10:42,959 –> 00:10:44,959
به طوری که
239
00:10:44,959 –> 00:10:45,440
240
00:10:45,440 –> 00:10:49,600
241
00:10:50,160 –> 00:10:53,200
اگر کد api شما موفقیت آمیز باشد، اساساً لحن و سرعت صدا است، سپس
242
00:10:53,200 –> 00:10:54,800
بدنه پاسخ
243
00:10:54,800 –> 00:10:56,480
حاوی داده است. با ساختار زیر،
244
00:10:56,480 –> 00:10:58,959
بنابراین ساختار این است
245
00:10:58,959 –> 00:11:03,120
و تقریباً
246
00:11:03,120 –> 00:11:04,560
همه چیز درست است، ما نیازی به نگرانی در مورد
247
00:11:04,560 –> 00:11:06,640
این موضوع
248
00:11:06,640 –> 00:11:09,279
نداریم و برای ورودی می توانیم یک
249
00:11:09,279 –> 00:11:10,320
متن معمولی
250
00:11:10,320 –> 00:11:14,079
یا فرمت ssml ارائه کنیم که یک نشانگر html صوتی
251
00:11:14,079 –> 00:11:14,800
است
252
00:11:14,800 –> 00:11:19,760
که من نمی خوانم. به جزئیات بیش از حد روی
253
00:11:20,320 –> 00:11:22,320
و این پارامتر صدا است، بنابراین ما
254
00:11:22,320 –> 00:11:23,920
میتوانیم کد زبانی را
255
00:11:23,920 –> 00:11:26,880
که میخواهید متنی را به
256
00:11:26,880 –> 00:11:28,800
زبانهای مختلف مانند ژاپ