THIẾT KẾ CHẾ TẠO ROBOT ĐIỀU KHIỂN TỪ XA BẰNG GIỌNG NÓI - Pdf 32

Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010
38
THIẾT KẾ CHẾ TẠO ROBOT ĐIỀU KHIỂN TỪ XA BẰNG GIỌNG NÓI
DESIGN AND MANUFACTURING REMOTE CONTROL ROBOT BY VOICE

SVTH: Nguyễn Phú Sinh
Lớp 05CĐT1, Khoa Cơ khí, Trường Đại học Bách khoa
GVHD: PGS.TS. Trần Xuân Tùy
Khoa Cơ khí, Trường Đại học Bách khoa

TÓM TẮT
Lĩnh vực Robot ngày càng chiếm được sự quan tâm của các nhà nguyên cứu và xã hội.
Một trong những vấn đề rất được quan tâm khi nghiên cứu robot là làm thế nào để có thể giao tiếp
giữa người - robot. Báo cáo này sẽ trình bày kết quả nghiên cứu, thiết kế chế tạo robot điều khiển
từ xa bằng giọng nói. Trong đó giới thiệu các tính toán cơ bản các cơ cấu của robot, thiết kế mạch
điều khiển từ xa và chương trình nhận dạng giọng nói tiếng Việt.
ABSTRACT
Nowadays, robot research field has been attracted attention from researchers and society.
One of the most concerned matters when researching on robot is how to get into communication
between human and robot. This report will present results of researching, designing and
manufacturing remote control robot by voice. In which, we would like to introduce basic calculations
of robot’s structures, the design of remote control circuit and the program for Vietnamese voice
identification.
1. Mở đầu
Đã từ lâu con người luôn mơ ước chế tạo được những máy móc thông minh, có một
số chức năng thay thế con người, như khả năng nhìn và nhận dạng được các vật thể, nghe
và thực hiện theo lời nói của con người. Nhưng cho mãi đến những năm gần đây, khi có
những lý thuyết mới về xử lý thông tin và công nghệ phát triển, thì mơ ước đó mới dần trở
thành hiện thực. Tuy thế, cho đến nay, giao tiếp giữa người với máy đã được cải thiện rất
nhiều nhưng vẫn còn mức độ như thông qua bàn phím hay các thiết bị xuất nhập khác.
Giao tiếp giữa người với máy bằng giọng nói sẽ là phương thức giao tiếp hiện đại và có ý

L1, L2: là chiều dài của khâu thứ 2 và khâu thứ 3
L3: là khoảng cách từ tâm vật cần nâng đến khớp thứ 3
Ta sẽ dễ dàng xác định được mômen sơ bộ tại các khớp 2 và khớp 3 (hình 1)
Mômen tại khớp 2: M1 = W1*L1/2 + L1*W4 + (L1+L2/2)*W2+ (L1+L3)*W3
Mômen tại khớp 3: M2 = L2/2*W2 + L3*W3
Từ đó có thể chọn được cơ cấu truyền động và các động cơ hợp lý.

Chuyến động của khâu 3 được động cơ tác động thông qua cơ cấu tay quay con
trượt (hình 2). Cơ cấu tay quay con truợt là cơ cấu bốn khâu bản lề có bốn khớp thấp. Để
tránh ma sát lớn trong cơ cấu mà con trượt chủ động, tay quay bị dẫn thì cơ cấu cần thỏa
mãn điều kiện:

axm
   
  
(1)
Hàm vị trí của cơ cấu khi con trượt chủ động:
Hình 2. Cơ cấu tay quay con trượt
Hình 3. Động cơ khớp 2 sau khi gắn hộp giảm tốc
Hình 1. Sơ đồ phân tích lực hai bậc của cánh tay robot
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010
40

 
 
2
2 2 2
0
2
2

Vì vậy ta chọn vít me Ø10, chiều dài 180 mm. Động cơ dẫn động là động cơ Pitman DC
24v, 80 vòng/phút.
Khớp thứ 2 được truyền động bằng động cơ DC 24V, 30W, 120 vòng/phút. Do tốc
độ động cơ quá lớn nên khó điều khiển vị trí chính xác, đặc biệt là với tay máy đòi hỏi độ
chính xác cao. Nên ta cần phải giảm tốc cho động cơ thông qua hộp giảm tốc Hospital có
tỷ số truyền 1:60 từ động cơ Maxon, Nhật Bản. Động cơ khớp 2 sau khi gắn hộp giảm tốc
Hospital như hình 2.
53
80
246
28055
100
430
13
12
11
10
9
8
765
4
3
2
1
14

Hình 4. Kết cấu chung của robot
1 - đế robot; 2 - nhôm hộp 25x50; 3 – eru Ø6; 4 - khớp xoay 1; 5 - ổ bi Ø12; 6 - động cơ Pitman nhỏ;
7 - trục vít me Ø10; 8 - vít Ø6; 9 - bánh xe; 10 - động cơ lép; 11- động cơ khớp 2; 12 - hộp giảm tốc;
13 - bạc ổ bi Ø12; 14 - khâu 2.

U201
7805
VIN
1
VOUT
3
GND
2
Q201
2
31
12v
PWM2
24V
RLA2
J7
DC2
1
2
CB6
LS7
3
5
1
4
6
2
7
8
D192

OUT4
15
OUT5
14
OUT6
13
OUT7
12
OUT8
11
CB4
CB5
12v
D608
PWM1
RELAY5
C46
104
D106
LED
PWM3
U4
PIC18F4331
RC7/R X/DT
26
GND
12
GND
31
RC0/T1OSO/T1CLK

35
RB3/PWM3
36
RB4/PWM5
37
RB5/PWM4
38
RB6/PGC
39
RB7/PGD
40
MCLR/VPP
1
OSC1/CLK
13
VDD
11
VDD
32
RD0/PSP0
19
RD1/SD O
20
RD2/SD I/SDA
21
RD3/SC K/SCL
22
RD4
27
RD5/(PW M4)

4
5
6
7
CB6
1
3
2
Q25
CB5
CB3
CB4
CB1
CB2
5v
5v
DC2
DC1
RS
DC3
+
C5
220
12VC
C47
104
PWM2
D609
OK2
D47

CB1
R116
+
C201
2200
24V
D108
D109
RELAY6
RELAY4
PWM6
D110
D53
OP14
12
43
J203
1
2
PWM5
+
C711
220_16v
C731
104
U5 ULN2803
COM
10
GND
9

OUT8
11
OP15
12
43
C6
+
C7
220
PWM1
RX
J11
DC3
1
2
12v
OP16
12
43
C48
104
C209
104
J707
1
2
3
4
5
5v

D1008
R705
10k
CLK74
Vpp
E
C210
104
R13
10k
17
6
5
4
3
2
TANG KHUYECH DAI
RELAY2
Y2
4M
C702
22p
C703
22p
J924
I2C
1
2
3
D610

Q29
A1013
2
3 1
Q30
C23832
31
LS9
3
5
1
4
6
2
7
8
+
C211
2200
OP18
12
43
OP19
12
43
D611
DC5
DC6
ENCOR1
LS10

clock
D111
LED
D612
1
3
2
Q31
12v
OP20
12
43
R119
R120
J6005
CON3
1
2
3
MT2
R8
330
Q32
A1013
2
3 1
D48
1 2
1
3

2
Q37
MT3
MT1
Q38
A1013
2
3 1
MT2
RLA6
MT3
Vdd
RELAY3
Q41
C23832
31
OP22
12
43
D42
4007
OP23
12
43
OP24
12
43
C8
D74
1N4007

C23832
31
ENCOR2
R122
RELAY5
R123
RL2 RLA2
RL5
RL6
RLA3RL3

Hình 3. Sơ đồ nguyên lý mạch thu.
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010
41
2.2.1. Tầng xử lý trung tâm
Sử dụng chip PIC18F4331, do chip này có 4 chân hỗ trợ điều xung PWM, ngoài ra
còn 2 chân CCP có thể hoạt động ở chế độ PWM. Vậy tổng cộng có 6 chân điều xung, phù
hợp với robot thiết kế, có 6 động cơ DC cần phải điều khiển tốc độ.
2.2.2. Tầng cách ly
Vì tầng xử lý trung tâm có tín hiệu ra là 5V, trong khi đó các động cơ dùng trong
robot đều hoạt động ở12V- 24V do đó ta phải dùng opto coupler như một khoá chuyển từ
5V sang 12V. Mạch này sử dụng bộ cách quang PC817.

CC LED DIODE
LED
V V V
5 1,7 1,2
R 210Ω
I 10


Pcs = I .R 50 .330 0,82W

Chọn điện trở R = 330 Ω , P =1 đến 2 W.
2.3. Xây dựng hệ thống nhận dạng giọng nói
Sơ đồ tổng quát của một hệ thống nhận dạng tiếng nói được thể hiện trên hình 6.

Hình 6. Sơ đồ tổng quát của hệ thống nhận dạng tiếng nói.
2.3.1. Thực hiện ghi âm và tách từ
Tiếng nói được thu âm qua một micro kết nối với máy tính. Tiếng nói sau khi được
thu âm từ micro, dùng kỹ thuật xử lý đầu cuối để tách tín hiệu tiếng nói ra khỏi nền nhiễu.
Tuy có nhiều phương pháp tách tiếng nói khác nhau, nhưng qua quá trình nghiên cứu tác
giả thấy phương pháp kết hợp giữa hàm năng lượng thời gian ngắn và tỷ lệ qua điểm zero
cho kết quả tốt hơn.
Với một cửa sổ kết thức tại mẫu thứ m, hàm năng lượng thời gian ngắn E(m) được
xác định:
Tách từ

Trích đặc trưng
MFCC
Đối sánh
mẫu
Kết quả
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010
42

( ) ( ( )* ( ))
n
E m S n W n m



pháp trích đặc trưng đã và đang được sử dụng như FBA, MFCC, LPC, PLP...Mỗi phương
pháp đều có những ưu nhược
điểm riêng. Hiện nay MFCC
(Mel- scale Frequency
Cepstral Coefficient) được sử
dụng phổ biến và hiệu quả
nhất. Vì vậy sử dụng MFCC
làm đặc trưng của hệ nhận
dạng được trình bày trong báo
cáo này.
MFCC là phương pháp
trích đặc trưng dựa vào đặc
điểm cảm thụ từ tần số âm của tai người : tuyến tính đối với tần số nhỏ hơn 1kHz và phi
tuyến đối với tần số trên 1kHz (Theo thang tần số Mel). Ngoài ra trong hệ nhận dạng còn
bổ xung them các hệ số delta MFCC.
2.3.3. Đối sánh mẫu
Đối sánh mẫu là một trong những cách tiếp cận cơ bản để giải quyết bài toán nhận
dạng. Trong lĩnh vực nhận dạng tiếng nói, cách tiếp cận này cũng được sử dụng và có hiệu
Hình 8. Sơ đồ trích đặc trưng tiếng nói MFCC


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status