「정보의 바다」로 표현되는 인터넷의 월드 와이드 웹(WWW)은 자칫「정보의 지옥」이 될 수도 있다. 처음 접했다면 도대체 어디에 무슨 정보가 있으며 어떻게 찾아가야 하는지 감을 잡을 수 없기 때문이다. 바로 이럴 때 도움을 받을 수 있는 것이 정보가 있는 사이트를 찾아주는 「서치엔진」들이다.서치엔진을 통해서 정보를 찾는 방법은 크게 두 갈래다. 첫째는 주제별로 정보를 분류해 놓은 항목을 둘러보는 디렉토리방식이며, 두번째는 원하는 정보와 관련된 단어들을 입력해 직접 그 정보가 담겨있는 곳으로 들어가는 키워드방식이다. 디렉토리방식은 아무런사전지식없이 인터넷의 전분야를 마음껏 누빌 수 있다는 점에서 초보자에게 매력적이며 키워드방식은 처음부터 구체적인 질의어를 입력해 재빨리 원하는 결과를 얻을 수 있다는 점에서 전문적인 정보를 원하는 사람들에게 유용하다.◆ 키워드방식은 단어연산으로 정보 찾아가장 널리 애용되고 있는 서치엔진은 디렉토리분류에 강점을 가지고 있는 야후(Yahoo)와 키워드검색이 뛰어난 알타비스타(AltaVista) 인포시크(Infoseek)등이다. 이들을 만나는 것은 어렵지 않다. 웹 프로그램으로 넷스케이프를 쓰고 있다면 초기화면의 상단부에 있는 네트 서치(Net Search) 단추를 선택하면 된다. 그러면 널리 쓰이고 있는 유명한 서치엔진들이 위치한 서버에 접속할 수 있게 된다.대개의 서치엔진들은 모두 디렉토리방식과 키워드방식의 기능을 겸비하고 있으므로 디렉토리방식으로 정보를 찾는다면 관련된 주제를계속 클릭해 들어가면 된다. 예를 들어 야후의 초기화면에서 「국가 지역」을 선택하고 다시 국가일람이 나오면 「싱가포르」식으로찾아들어가는 것이다. 키워드로 한다면 단어를 입력하는 난에 「싱가포르」를 직접 입력하면 된다.그러나 이렇게 단어를 입력하다보면 너무 많은 관련 사이트가 나와당황하게 된다. 알타비스타에 「ASEAN」(동남아국가연합)이란 검색어를 던져주면 수만개의 관련사이트가 나타난다. 그래서 키워드방식은 단어연산을 통해서 구체적인 정보를 찾을 수 있게 만들어져있다. 예를들어 아세안중에서도 경제와 관련된 사이트를 알고 싶으면 단어입력란에 「ASEAN and ECONOMY」식으로 「and」연산을 하면된다.물론 더 많은 검색어를 입력해도 되며 검색어중 어느 하나와 관련된 사이트를 찾을 때는 「or」연산을 하면 된다. 또 하나 유용한방법은 「near」라는 연산이다. 예를 들어 「ASEAN near ECONOMY」를 입력하게 되면 웹사이트내부의 정보중에 두 개의 단어가 가깝게나타나는 사이트들을 찾아준다.문제는 이같은 서치엔진들이 기본적으로 영어를 써야만 된다는 사실이다. 그래서 영어를 잘 이해하지 못하는 사람이라면 인터넷에들어갔다가도 별다른 흥미를 느끼지 못하고 바로 빠져나올 수 있다. 그러나 이런 사람들을 위해서 한글작업을 지원하는 한글서치엔진들이 존재한다. 현재 국내에 가동중인 한글서치엔진으로는 한글과 컴퓨터가 선보인 「심마니」를 비롯, 한국통신의 「인터넷정보탐험」, 충남대학교의 「코시크(Kor-seek)」, 대구대학교의 「까치네」, 한국과학기술원의 「미스 다찾니」 등이 있다. 특히 심마니는 성능과 속도가 탁월한데다 유의어기능까지 지원하고 있어 정보검색의 효율을 극대화했다는 평가를 받고 있다. 또 코시크는 검색어와 디렉토리형태로 웹사이트를 찾아볼 수 있게 하고 있으며 까치네는 국내 웹 페이지의 수를 알려주는 독특한 서비스로 인기를 끌고 있다.한글서치엔진중 다양함이 돋보이는 심마니는 한글과 컴퓨터의 자연어처리팀에서 제작한 것이다. 국내의 웹사이트정보를 수집하는 검색로봇이 네트워크속을 돌아다니면서 수시로 정보를 모아 놓고 이를 통해 지속적으로 새로 등장하는 웹페이지들의 데이터베이스를만들어놓는다. 재미있으면서 시사적인 것은 사용자들이 어떤 검색어를 선호하고 있는가를 보여주는 「검색어 톱10」이란 기능이다.이는 심마니의 단어검색란에 입력되는 검색어가 자동집계됨으로써나타나는데 지난 6월18일 현재 「섹스」라는 검색어가 6천7백58회의 검색으로 1위를 달리고 있다. 여기에 4위는 「sex」, 그리고 다시 「누드」 「포르노」라는 검색어가 많은 것을 보면 역시 성적인정보에 대한 욕구가 단연 압도적임을 알 수 있다.그러나 대학교 학교 일본 한국 신문 영화 인터넷 등의 검색어도 상위순위를 차지하고 있어 자신에게 유용한 정보를 찾으려는 사용자들의 노력도 엿볼 수 있다. 비슷한 기능으로 「홈페이지 톱10」이라는 것도 있다. 사용자들이 심마니를 통해서 어느 사이트에 자주접속하는지 그 빈도수를 순위로 매긴 것이다. 여기서는 중앙일보의「Joins」가 1위를 달리고 있는 홈페이지로 나타나 있다. 청와대의홈페이지는 7백60회의 접속으로 70위대에 머무르고 있었다.◆ 「섹스」 검색어 6천7백58회로 검색 1위한국통신 인터넷정보탐정은 키워드검색중에서도 다양한 연산으로정보검색의 효율성을 높이고 있다. 어떤 정확한 어구를 찾고 싶을때는 「“굳세어라 금순아”」같이 따옴표를 사용한다. 여행사나항공사란 단어가 하나만 들어있는 웹페이지를 모두 찾는다면 「여행사 + 항공사」가 되며 모두 들어있는 웹페이지를 원한다면 「여행사 * 항공사」를 입력하면 된다. 이밖에도 앞머리찾기 뒤꼬리찾기 등이 있어 어떤 단어로 시작되거나 끝나는 문서가 들어있는 웹페이지도 쉽게 찾을 수 있다.마하 인터넷 서비스라는 회사에서 운영하는 「코리아 디렉토리」는한글 혹은 영어를 선택적으로 사용하는 부분에서 강점을 가지는 서치엔진으로 우리나라에 관련된 국내외의 모든 웹사이트를 제공한다. 또 서버는 미국에 두고 있지만 한국과 관련된 모든 정보를 제공하는 「네트워크 코리아」란 엔진도 있다.한편 명칭이 재미있는 미스 다찾니라는 서치엔진은 한국과학기술원소프트웨어공학연구실 승현석 연구원이 혼자서 만든 것으로 까치네Kor-seek 알타비스타 등 인터넷상의 여러 서치엔진들과 정보를 교환, 사용자에게 필요한 정보를 제공해준다. 야후라는 서치엔진을미 스탠퍼드대학의 한 학생이 만들었듯이 지금 이 순간에도 국내의젊은 학생들이 인터넷의 한글적용을 위해 서치엔진을 개발하고 있다.