Internet và Khai thác thông tin - Pdf 67

Internet và khai thác thông tin
Bùi V Anh - Trng HKH T nhiên Hà Ni
1
INTERNET VÀ KHAI THÁC THÔNG TIN
CLB Toán – Tin, Khoa Toán – C – Tin hc,
Trng H Khoa hc T nhiên Hà Ni.
1. Gii thiu
Trong hn hai thp k va qua, chúng ta đã chng kin s ra đi và phát trin mnh m ca
mng và internet
1
. Internet ra đi đc coi là mt phát minh ln trong th k 20 và nó đã làm thay
đi th gii. Nh có internet, khong cách đa lý b xoá nhoà, th gii hi nhp và m ra xu hng
phát trin mi. Không nhng th, internet là mt môi trng chia s và cung cp tài nguyên thông
tin rt ln. Nh đó, kho tàng tri thc ca nhân loi đc hoàn thin và khai thác hiu qu hn. Bài
vit này chúng tôi mun đ cp đn internet theo khía cnh khai thác thông tin phc v trao đi, hc
tp và nghiên cu.

2. C ch, cách thc tìm kim và s dng thông tin trên mng
2.1 Kt ni internet
Ngi s dng có th dùng các trình duyt web nh Internet Explorer, Nescape, Mozilla… đ
duyt (lt) web. Trong mi trình duyt có nhng thit lp riêng đ kt ni internet. Mun m trang
web khi đã bit đa ch, gõ đa ch vào ô đa ch ca trình duyt.

Hình 1. M trang web ca Trng HKHTN.
2.2 Tìm kim thông tin
 tìm kim đc thông tin qua mng, các nhà cung cp dch v cung cp các máy tìm
kim
2
. Máy tìm kim là c ch tìm kim trên mng thông qua các t khoá… Cn c vào các t
khoá đc cung cp, các máy tìm kim tìm trong c s d liu ca mình các trang web cha ni
dung t khoá đó. Các t khoá có th xut hin trong trang web, trong tiêu đ ca trang hay cha

gia ca các t khoá. Máy ch tìm kim s có c ch riêng đ phân rã biu thc này phc v cho vic
tìm kim hiu qu; và vic so sánh vi t khoá không nht thit là so sánh khp chính xác. Ví d
khi cn tìm các tài liu v chính tr hoc kinh t, có th vit trong phn t khoá tìm kim là “chính
tr” OR “kinh t”. Các t khoá gm nhiu t ghép li cn đt trong cp du nháy kép. Trng hp
không đt trong cp du này, các trang web cha mt trong các t đó đu đc lit kê, kt qu là s
trang web tìm thy s nhiu hn, vic đc và tìm ra trang web cn thit cng mt thi gian hn, đôi
khi các trang web tìm thy không cha chút ni dung nào so vi yêu cu.
Vi các tìm kim có nhiu chi tit, ta có th chn thêm mt s tiêu chun khác nh cách
thc các t khoá tìm kim xut hin trong tài liu tìm đc, thi gian, dng lu tr, tên min lu tr
tài liu… Ta có th yêu cu tt c các t khoá, chính xác nhóm t khoá hoc mt trong s các t

Hình 2. Tìm kim nâng cao trong Google
Internet và khai thác thông tin
Bùi V Anh - Trng HKH T nhiên Hà Ni
3
khoá xut hin trong mt phn nào đó ca tài liu, hoc không xut hin các t trong danh sách t
khoá... Hoc yêu cu tìm các tài liu có mt đnh dng lu tr nào đó, tính cp nht ca tài liu (thi
gian cp nht gn đây nht) hay trang web tìm đc phi thuc min nào (thng gn vi ngôn ng
và quc gia). Ta cng có th đa các t mô t tính cht, đc đim ca tài liu trong phn t khoá tìm
kim. Máy tìm kim s so sánh các tính cht này vi tính cht ca trang web tìm thy đ quyt đnh
nó có đc nm trong danh sách các trang web kt qu hay không. Nhng tin ích này nhm lc b
bt các thông tin không cn thit.  tìm chính xác mt tài liu, t khoá cung cp càng chi tit,
càng chính xác thì hiu qu ca vic tìm kim càng cao, tài liu tìm đc càng sát vi cái ta cn,
đng thi cng hn ch các loi tài liu không cn thit. Ngc li, nu t khoá tìm kim rng thì
lng tài liu tìm đc s nhiu và cn tn công sc đ đc và la chn tài liu phù hp. Nu mt
tìm kim mang li ít thông tin đ la chn, có th gim các yêu cu.

Mt máy tìm kim khác cng thng đc s dng, ca Yahoo  đa ch
. Máy tìm kim này đc Yahoo mua ca Google đ ci tin. Do vy, các
tính nng có phn tng t tuy cách b trí các tài liu tìm thy khác nhau. Yahoo phân nhánh các tài

i vi tìm kim tài liu ting Vit, cn quan tâm thêm đn dng mã hoá ting Vit (b
gõ). Nu tài liu đc ch bn dùng font ch unicode, phm vi tìm kim là không b hn ch vi các
máy tìm kim hin có. Các tài liu, trang web s dng b gõ c khi ch bn và cha đc chuyn
mã, các ký t có th đc mã hoá di dng VIQR, TCVN, VNI, Vietware… iu này gây khó
khn cho các máy tìm kim bi c ch tìm kim là s so sánh mã ca t khoá tìm kim vi mã ca
thông tin cha trong trang web. S sai khác này dn đn b sót nhng thông tin có ích, cn thit.
Sau khi tìm kim, các mc tài liu tìm đc s đc lit kê theo tng trang, các trang xut hin v
sau thng có t l khp vi t khoá tìm kim thp hn.

3. Giao dch bng h thng email
S dng email đ trao đi thay h thng th tín thông thng càng ngày càng ph bin. Có
các tiêu chun v mt k thut nh chun http (dùng chung vi web), chun POP3, IMAP… đ ly
đc th v và đc đc ti máy mà không cn kt ni internet. Chúng tôi xin gii thiu hai chng
trình sau đc dùng ph bin, chy trên h điu hành Windows h tr vic đó. C hai chng trình
ging nhau v tính nng c bn, đc la chn dùng theo thói quen và nhu cu.
Internet và khai thác thông tin
Bùi V Anh - Trng HKH T nhiên Hà Ni
5Hình 6. Trang VinaSeek và cách thc b trí các trang đã tìm kim đc.
3.1 Outlook Express
Chng trình này có sn cùng Windows khi cài đt. Biu tng chng trình Outlook
Express thng có  Start\Programs. Thit lp thông tin cho Outkook đ t đng ly th t mt tài
khon đã có nh sau. Chn Tools\Accounts… Hình 8 s hin ra và sau khi nhp đy đ tên, đa ch
email, cn chn chun gi và nhn th phù hp. Thông thng, chun POP3 là ph bin cho các
Mail Server
3
. Nu h thng Mail Server dùng Microsoft Exchange Server thì chun là IMAP; hoc
chun http nh th ca hotmail. Vi h thng dùng Linux, POP3 cng hay đc chn. Tuy nhiên,


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status