ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA: CÔNG NGHỆ THÔNG TIN
BÁO CÁO THU HOẠCH
PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC
CÁC THỦ THUẬT (NGUYÊN TẮC) SÁNG TẠO
ĐƯỢC ÁP DỤNG VÀO BÀI TOÁN KHÁM PHÁ DỮ LIỆU
TRONG HỆ THỐNG THÔNG TIN DI ĐỘNG CỘNG TÁC Giảng viên: GS.TSKH. HOÀNG KIẾM
Lớp : CAO HỌC – HTTT - K22
Học Viên: NGÔ THÙY HƯƠNG – 12 12 016
TP. Hồ Chí Minh, 25 tháng 11 năm 2012
NgôThù yHương– 12 12 016 2
L
ỜI CẢM
NgôThù yHương– 12 12 016 3
MỤC LỤC
LỜI MỞ ĐẦU 7
TỔNG QUAN 8
CHƯƠNG 1:
I. Giới thiệu chung 8
1.1. Giới thiệu 8
1.2. Hướng tiếp cận 9
1.3. Nội dung đề tài 9
CƠ SỞ LÝ THUYẾT CHO CÁC NGHIÊN CỨU KHOA HỌC 11
CHƯƠNG 2:
I. VẤN ĐỀ KHOA HỌC VÀ CÁC PHƯƠNG PHÁP GIẢI QUYẾT 11
1.1. Khái niệm 11
1.2. Phân loại 11
1.3. Các tình huống vấn đề 11
1.4. Các phương pháp phát hiện vấn đề khoa học 12
1.5. Phương pháp giải quyết vấn đề theo khoa học về phát minh, sáng chế 12
II. 40 NGUYÊN TẮC SÁNG TẠO TRONG NGHIÊN CỨU KHOA HỌC 14
2.1. Nguyên tắc phân nhỏ 14
2.2. Nguyên tắc “tách khỏi” 14
2.3. Nguyên tắc phẩm chất cục bộ 14
2.4. Nguyên tắc phản đối xứng 15
2.5. Nguyên tắc kết hợp 15
2.6. Nguyên tắc vạn năng 15
2.33. Nguyên tắc đồng nhất 20
2.34. Nguyên tắc phân hủy hoặc tái sinh các phần 20
2.35. Thay đổi các thông số hoá lý của đối tượng 20
2.36. Sử dụng chuyển pha 20
2.37. Sử dụng sự nở nhiệt 20
2.38. Sử dụng các chất oxy hoá mạnh 20
2.39. Thay đổi độ trơ 21
2.40. Sử dụng các vật liệu hợp thành (composite) 21 NgôThù yHương– 12 12 016 5
PHÂN TÍCH CÁC KỸ THUẬT KHÁM PHÁ DỮ LIỆU & VIỆC ỨNG
CHƯƠNG 3:
DỤNG CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC TRONG ĐÓ 22
I. GIỚI THIỆU 22
1.1. Giới thiệu 22
1.2. Kỹ thuật khám phá dữ liệu trong kiến trúc COCA 22
1.3. Kỹ thuật khám phá dữ liệu trong kiến trúc COOP 24
1.4. Kỹ thuật khám phá dữ liệu trong mô hình cộng tác nhóm theo vùng CC
(Cluster Cooperative Caching) 25
1.5. Kỹ thuật khám phá dữ liệu trong cách tiệp cận khác cho cộng tác bộ nhớ
PROACTIVE (Proactive Approach Caching) 28
II. PHÂN TÍCH CÁC NGUYÊN LÝ SÁNG TẠO KHOA HỌC ĐƯỢC ÁP DỤNG
TRONG CÁC KỸ THUẬT KHÁM PHÁ DỮ LIỆU 30
2.1. Nguyên lý phân nhỏ 30
2.2. Nguyên tắc kết hợp 31
2.3. Nguyên tắc vạn năng 31
2.4. Nguyên tắc thực hiện sơ bộ 32
2.5. Nguyên tắc dự phòng 32
NgôThù yHương– 12 12 016 7
LỜI MỞ ĐẦU
Sự phát triển lịch sử xã hội loài người gắn liền với quá trình sáng tạo lâu dài và
liên tục, từ việc chế tạo ra các công cụ thô sơ cho tới công cụ hiện đại hơn sử dụng nhiệt
năng và tới sự phát minh ra điện đã đánh dấu một bước phát triển nhảy vọt trong sáng
tạo, các máy tính khổng lồ cho tới các máy tính cá nhân nhỏ gọn lần lượt xuất hiện.
Cùng với sự sáng tạo, con người ngày càng đạt được những thành tựu vượt bậc
trong khoa học công nghệ làm thay đổi thế giới, thay đổi hoàn toàn cách thức làm việc và
suy nghĩ của con người. Tuy nhiên, ngày nay do nhu cầu cải tiến sáng tạo trong công
nghệ phục vụ cho cuộc sống ngày càng cao đòi hỏi phải có một môn khoa học chuyên
nguyên cứu về phương pháp sáng tạo giúp cho việc sáng tạo được dễ dàng và có cơ sở lý
thuyết rõ ràng hơn. Vì thế các phương pháp luận sáng tạo ra đời với mục đích trang bị
cho người học hệ thống các phương pháp, các kỹ năng thực hành về suy nghĩ để giải
quyết các vấn đề và ra quyết định một cách sáng tạo, về lâu dài, tiến tới điều khiển được
tư duy. Và trong đó 40 nguyên tắc sáng tạo cơ bản được Alshuller G.S tổng hợp lại trở
thành những nguyên tắc thủ thuật cơ bản thiết thực nhất.
Trước hết, em xin gửi lời cảm ơn chân thành tới GS.TSKH. Hoàng Kiếm đã giảng
Discovery).
Với các ứng dụng trong mạng không dây, thì kho lưu trữ cục bộ của các thiết bị di
động rất hạn chế về mặt kích thước lưu trữ, do đó vấn đề đặt ra là phải tận dụng được
không gian lưu trữ sao cho hiệu quả. Chính vì thế, chúng ta cần quan tâm tới việc khám
phá và thu nạp mục dữ liệu như thế nào, để đảm bảo việc sử dụng tối ưu kho lưu trữ cục
bộ. Các kỹ thuật khám phá dữ liệu sẽ đề cập tới việc làm sao có thể tối ưu hóa chi phí khi
tìm kiếm một hạng mục dữ liệu trong hệ thống, giúp giảm thiểu số lần truy vấn tới máy NgôThù yHương– 12 12 016 9
chủ (hay còn gọi là BS (Base Station), Server, Data Source), rút ngắn thời gian phản hồi
truy vấn dữ liệu tại mỗi máy khách (hay còn gọi là Client, nút di động). Tuy nhiên, việc
tìm kiếm mục dữ liệu yêu cầu, và việc thêm vào một hạng mục dữ liệu không phải lúc
nào cũng thuận lợi vì quyết định sai có thể làm giảm tính sẵn sàng của dữ liệu.
Chính vì thế mục tiêu của bài thu hoạch “Các thủ thuật (nguyên tắc) sáng tạo được
áp dụng vào bài toán khám phá dữ liệu trong hệ thống thông tin di động cộng tác” là
tìm hiểu và phân tích những nguyên lý sáng tạo đã được áp dụng vào các kỹ thuật khám
phá dữ liệu.Từ kết quả phân tích có thể giúp cho những nhà nghiên cứu liên quan có lựa
chọn đúng đắn đến việc sử dụng kỹ thuật khám phá vào trong mỗi hệ thống đặc thù của
mình.
1.2. Hướng tiếp cận
Với mục tiêu đề tài đưa ra, hướng tiếp cận và giải quyết bài toán là sẽ tìm hiểu lần
lượt các kỹ thuật khám phá dữ liệu trong môi trường hệ thống thông tin di động từ các
công trình nghiên cứu trong và ngoài nước. Đồng thời sẽ tiến hành phân loại các trường
hợp của kỹ thuật khám phá dữ liệu đã tìm hiểu. Sau đó đánh giá và so sánh các ưu khuyết
điểm của các kỹ thuật phám phá dữ liệu. Và cuối cùng là đề xuất và thử nghiệm một số
kỹ thuật khám phá dữ liệu để kiểm tra tính hiệu quả của từng giải pháp.
1.3. Nội dung đề tài
Với mục tiêu, hướng tiếp cận, và cách giải quyết của bài thu hoạch “Các thủ thuật
NgôThù yHương– 12 12 016 11
CƠ SỞ LÝ THUYẾT CHO CÁC
CHƯƠNG 2:
NGHIÊN CỨU KHOA HỌC
I. VẤN ĐỀ KHOA HỌC VÀ CÁC PHƯƠNG PHÁP GIẢI QUYẾT
1.1. Khái niệm
Vấn đề khoa học (scientific problem) [19] cũng được gọi là vấn đề nghiên cứu
(research problem) hoặc câu hỏi nghiên cứu là câu hỏi được đặt ra khi người
nghiên cứu đứng trước mâu thuẫn giữa tính hạn chế của tri thức khoa học hiện có
với yêu cầu phát triển tri thức đó ở trình độ cao hơn.
1.2. Phân loại
Nghiên cứu khoa học luôn tồn tại hai vấn đề :
- Vấn đề về bản chất sự vật đang tìm kiếm
- Vấn đề về phương pháp nghiên cứu để làm sáng tỏ về lý thuyết và thực tiễn
những vấn đề thuộc lớp thứ nhất.
1.3. Các tình huống vấn đề
Có ba tình huống : Có vấn đề , không có vấn đề, giả vấn đề được cho trong
hình dưới đây: Có vấn đề Có nghiên cứu
Không có vấn đề
Không có nghiên cứu NgôThùyHương– 12 12 016 12
Nghiên cứu theo một
hướng khác
NgôThùyHương– 12 12 016 13
Nguyên lý phẩm chất cục bộ.
Nguyên lý (phản) bất đối xứng.
Nguyên lý kết hợp.
Nguyên lý vạn năng.
Nguyên lý “chứa trong”.
Nguyên lý phản trọng lượng.
Nguyên lý gây ứng suất (phản tác động) sơ bộ.
Nguyên lý thực hiện sơ bộ.
Nguyên lý dự phòng.
Nguyên lý đẳng thế.
Nguyên lý đảo ngược.
Nguyên lý cầu (tròn) hóa.
Nguyên lý linh động.
Nguyên lý giải (tác động) “thiếu” hoặc “thừa”.
Nguyên lý chuyển sang chiều khác.
Sử dụng các dao động cơ học.
Nguyên lý hoạt động theo chu kỳ.
Nguyên lý liên tục các tác động có ích.
Nguyên lý “vượt nhanh”.
Nguyên lý biến hại thành lợi.
Nguyên lý quan hệ phản hồi.
Nguyên lý sử dụng trung gian.
Nguyên lý tự phục vụ.
b) Các phần khác nhau của đối tượng phải có các chức năng khác nhau.
c) Mỗi phần của đối tượng phải ở trong những điều kiện thích hợp nhất đối
với công việc. NgôThùyHương– 12 12 016 15
2.4. Nguyên tắc phản đối xứng
Chuyển đối tượng có hình dạng đối xứng thành không đối xứng (nói chung
giảm bậc đối xứng).
2.5. Nguyên tắc kết hợp
a) Kết hợp các đối tượng đồng nhất hoặc các đối tượng dùng cho các hoạt
động kế cận.
b) Kết hợp về mặt thời gian các hoạt động đồng nhất hoặc kế cận.
2.6. Nguyên tắc vạn năng
Đối tượng thực hiện một số chức năng khác nhau, do đó không cần sự tham
gia của các đối tượng khác.
2.7. Nguyên tắc “chứa trong”
a) Một đối tượng được đặt bên trong đối tượng khác và bản thân nó lại chứa
đối tượng thứ ba
b) Một đối tượng chuyển động xuyên suốt bên trong đối tượng khác.
2.8. Nguyên tắc phản trọng lượng
a) Bù trừ trọng lượng của đối tượng bằng cách gắn nó với các đối tượng
khác có lực nâng.
b) Bù trừ trọng lượng của đối tượng bằng tương tác với môi trường như sử
dụng các lực thủy động, khí động
2.9. Nguyên tắc gây ứng suất sơ bộ
Gây ứng suất trước với đối tượng để chống lại ứng suất không cho phép
hoặc không mong muốn khi đối tượng làm việc (hoặc gây ứng suất trước để
khi làm việc sẽ dùng ứng suất ngược lại ).
Nếu như khó nhận được 100% hiệu quả cần thiết, nên nhận ít hơn hoặc
nhiều hơn “một chút”. Lúc đó bài toán có thể trở nên đơn giản hơn và dễ
giải hơn.
2.17. Nguyên tắc chuyển sang chiều khác
a) Những khó khăn do chuyển động (hay sắp xếp) đối tượng theo đường
(một chiều) sẽ được khắc phục nếu cho đối tượng khả năng di chuyển trên
mặt phẳng (hai chiều). Tương tự, những bài toán liên quan đến chuyển NgôThùyHương– 12 12 016 17
động (hay sắp xếp) các đối tượng trên mặt phẳng sẽ được đơn giản hoá khi
chuyển sang không gian (ba chiều).
b) Chuyển các đối tượng có kết cấu một tầng thành nhiều tầng.
c) Đặt đối tượng nằm nghiêng.
d) Sử dụng mặt sau của diện tích cho trước.
e) Sử dụng các luồng ánh sáng tới diện tích bên cạnh hoặc tới mặt sau của
diện tích cho trước.
2.18. Nguyên tắc sử dụng các dao động cơ học
a) Làm đối tượng dao động. Nếu đã có dao động, tăng tầng số dao động (
đến tầng số siêu âm).
b) Sử dụng tầng số cộng hưởng.
c) Thay vì dùng các bộ rung cơ học, dùng các bộ rung áp điện.
d) Sử dụng siêu âm kết hợp với trường điện từ.
2.19. Nguyên tắc tác động theo chu kỳ
a) Chuyển tác động liên tục thành tác động theo chu kỳ (xung).
b) Nếu đã có tác động theo chu kỳ, hãy thay đổi chu kỳ.
c) Sử dụng các khoảng thời gian giữa các xung để thực hiện tác động khác.
2.20. Nguyên tắc liên tục tác động có ích
a) Thực hiện công việc một cách liên tục (tất cả các phần của đối tượng cần
c. Nếu không thể sử dụng bản sao quang học ở vùng biểu kiến (vùng ánh
sáng nhìn thấy được bằng mắt thường), chuyển sang sử dụng các bản sao
hồng ngoại hoặc tử ngoại.
2.27. Nguyên tắc “rẻ” thay cho “đắt”
Thay thế đối tượng đắt tiền bằng bộ các đối tượng rẻ có chất lượng kém
hơn (thí dụ như về tuổi thọ). NgôThùyHương– 12 12 016 19
2.28. Thay thế sơ đồ cơ học
a. Thay thế sơ đồ cơ học bằng điện, quang, nhiệt, âm hoặc mùi vị.
b. Sử dụng điện trường, từ trường và điện từ trường trong tương tác với đối
tượng
c. Chuyển các trường đứng yên sang chuyển động, các trường cố định sang
thay đổi theo thời gian, các trường đồng nhất sang có cấu trúc nhất định .
d. Sử dụng các trường kết hợp với các hạt sắt từ.
2.29. Sử dụng các kết cấu khí và lỏng
Thay cho các phần của đối tượng ở thể rắn, sử dụng các chất khí và lỏng:
nạp khí, nạp chất lỏng, đệm không khí, thủy tĩnh, thủy phản lực.
2.30. Sử dụng vỏ dẻo và màng mỏng
a. Sử dụng các vỏ dẻo và màng mỏng thay cho các kết cấu khối.
b. Cách ly đối tượng với môi trường bên ngoài bằng các vỏ dẻo và màng
mỏng.
2.31. Sử dụng các vật liệu nhiều lỗ
a. Làm đối tượng có nhiều lỗ hoặc sử dụng thêm những chi tiết có nhiều lỗ
(miếng đệm, tấm phủ…)
b. Nếu đối tượng đã có nhiều lỗ, sơ bộ tẩm nó bằng chất nào đó.
2.32. Nguyên tắc thay đổi màu sắc
a. Thay đổi màu sắc của đối tượng hay môi trường bên ngoài
2.38. Sử dụng các chất oxy hoá mạnh
a. Thay không khí thường bằng không khí giàu oxy.
b. Thay không khí giàu oxy bằng chính oxy.
c. Dùng các bức xạ ion hoá tác động lên không khí hoặc oxy.
d. Thay oxy giàu ozon (hoặc oxy bị ion hoá) bằng chính ozon. NgôThùyHương– 12 12 016 21
2.39. Thay đổi độ trơ
a. Thay môi trường thông thường bằng môi trường trung hoà.
b. Đưa thêm vào đối tượng các phần , các chất , phụ gia trung hoà.
c. Thực hiện quá trình trong chân không.
2.40. Sử dụng các vật liệu hợp thành (composite)
Chuyển từ các vật liệu đồng nhất sang sử dụng những vật liệu hợp thành
(composite). Hay nói chung sử dụng các vật liệu mới.
.
nhớ cục bộ của chính nó. Nếu không tìm thấy dữ liệu trong bộ nhớ cục bộ, nó sẽ gửi yêu
cầu đến các MHs trong nhóm là: MH
1
, MH
3
, MH
7
trước khi gửi yêu cầu lên BS. NgôThùyHương– 12 12 016 23 Hình 2 - 1: Kiến trúc COCA
Quá trình khám phá dữ liệu
Quá trình khám phá mục dữ liệu của kiến trúc COCA được mô tả như trong Error!
Reference source not found., Khi nhận được yêu cầu dữ liệu từ người dùng:
Bước 1: Đầu tiên, MH nguồn sẽ tìm kiếm mục dữ liệu yêu cầu trong bộ nhớ cục
bộ (Local Cache Hit).
Bước 2: Nếu dữ liệu không được tìm thấy trong bộ nhớ cục bộ thì yêu cầu tìm
kiếm sẽ được gửi “broadcast” đến các MHs trong vùng đồng thời tiếp tục lắng
nghe tại kênh truyền “broadcast” được phát ra từ BS
Bước 3: Trong lúc chờ dữ liệu xuất hiện trên kênh truyền “broadcast”, nếu một
trong số các MHs đích trong vùng có dữ liệu yêu cầu, MH đích trong vùng sẽ trả
dữ liệu về cho MH nguồn trước khi có dữ liệu trên kênh truyền “broadcast”,
MH nguồn sẽ chọn MH đích trả dữ liệu về sớm nhất và sẽ gửi thông điệp
“retrieve” đến MH đích đó để nhận dữ liệu trả về (Global Cache Hit).
Bước 4: Trong trường hợp các MHs trong vùng không tìm thấy dữ liệu yêu cầu
trong một khoảng thời gian nhất định, MH nguồn phải đợi đến khi dữ liệu xuất
Khi một MH yêu cầu mục dữ liệu:
Bước 1: Đầu tiên đầu tiên MH nguồn sẽ tìm kiếm trong bộ nhớ cục bộ của MH
đó, nếu có dữ liệu, yêu cầu được giải quyết.
Bước 2: Nếu không tìm thấy, MH nguồn tiếp tục tìm kiếm trong kho dữ liệu cục
bộ của các MH trong vùng của MHi, nếu tìm thấy dữ liệu, yêu cầu được giải quyết.
Bước 3: Nếu không, MH nguồn sẽ gửi yêu cầu dữ liệu đến BS để giải quyết yêu
cầu dữ liệu. Trên đường đi đến BS, MH sẽ đi qua các MH trung gian, nếu tồn tại MH
trung gian nào chứa dữ liệu yêu cầu, MH trung gian đó sẽ gửi dữ liệu về cho MH yêu cầu
dữ liệu ban đầu, yêu cầu dữ liệu được giải quyết, quá trình gửi dữ liệu đến BS kết thúc.
1.4. Kỹ thuật khám phá dữ liệu trong mô hình cộng tác nhóm theo vùng
CC (Cluster Cooperative Caching)
Trong công trình nghiên cứu [3], tác giả Narottam Chand, R.C JoShi and Manoj
Misra đề cập tới mô hình cộng tác theo vùng CC (Cluster Cooperative Caching). Trong
CC, các cấu trúc liên kết mạng được phân chia thành các vùng kích thước bằng nhau,
CC cải tiến đáng kể độ trễ truy vấn trung bình so với các chiến lược bộ nhớ đệm khác,
nâng cao hiệu quả về mặt cộng tác và sử dụng bộ nhớ.
Khái quát kiến trúc
Trong mỗi vùng, CC tự động chọn một MH trạng thái CSN (Cache State Node),
CSN lưu trữ danh sách thông tin kho lưu trữ của các MH khác trong cụm CCS (Cluster