당신의 하루는 어떻게 시작하는가? 현대사회에서 스마트폰으로 뉴스기사를 검색하며 하루를 시작하는 일은 주변에서 찾기가 너무나 쉬워졌다. 컴퓨터 잘하는 법, 요리하는 방법, 버스시간 검색, 맛집 검색..등 검색엔진은 어느새 무엇인가를 궁금해하고 정보를 얻기 원하는 사람들에 신과 같은 없어서는 안되는 존재가 됐다.
검색창에서 궁금한 점을 입력하기만 하면 우리는 검색엔진을 통해 전세계의 데이터를 검색할 수 있고 그중 나에게 가장 알맞은 자료를 찾아 보여준다. 물론 정확히 내가 원하는 자료를 찾기 어려울 때도 있다. 엉뚱한 자료만 잔뜩 나온다면 화가 나서 그 검색엔진을 이용하고 싶지 않을지도 모른다.
많은 검색엔진 중에서 자기가 원하는 정보를 가장 잘 찾아주는 검색엔진을 주로 사용하는데, 그 중 세계적으로 그 선두에 있는 검색엔진이 구글이다. 그리고 그 비결은 과학적인 수학에 있다.
우리가 주로 사용하는 대표적인 검색엔진에는 네이버, 다음, 야후, 구글 등이 있는데 그 중 세계에서 가장 인기있는 검색엔진을 꼽자면 바로 구글이라고 대답하겠다.
그럼 구글은 어떻게 탄생하게 되었을까?
구글의 역사는 어디에서부터 시작 되었을까? 구글의 창립자인 래리 페이지와 세르게이 브린은 1995년 스탠퍼드 대학원에서 만나게 된다. 동갑인 둘은 급속도로 친해졌으며 수학에 재능이 있는 브린과 컴퓨터에 대해서 잘 알고있는 페이지는 수학을 이용하여 컴퓨터에 관한 연구를 시작하게 된다.
브린은 수학에 남다른 재능을 보였는데, 불과 21살의 나이에 메릴랜드대의 컴퓨터공학과 와 수학과를 우수한 성적으로 졸업한 수재이다. 그리고 페이지는 컴퓨터 공학과 교수의 아버지로부터 영향을 받았고, 어려서부터 컴퓨터를 하며 지냈기에 컴퓨터에 대해서는 또래보다 훨씬 많이 알고 있었다.
그당시 페이지의 관심사는 월드와이드웹(www)이었다고 한다. 인터넷에 연결되어 있는 컴퓨터를 통하여 사람들과 정보를 공유할 수 있는 공간을 말하는데, 그것을 페이지는 거대한 그래프로 생각을 했고 그 연결구조를 이해하기 위해 수학성질을 이용해야 했다. 그랬기에 수학에 뛰어난 브린이 연구파트너로 제격이었으며 둘은 함께 연구하게 되었다. 두 사람의 연구는 시작한지 1년도 채 되지않아 성과가 나타나기 시작했다.
순위가 높은 순으로 검색결과를 보여주는' 페이지랭크기술' 을 개발한것이다. 현재 우리가 너무나 유용하게 쓰고 있는 이기술은 아직까지도 다른 검색엔진이 따라올 수 없을 정도로 독보적인 기술이며 인정 평가받고 있다.
페이지랭크 알고리즘 속의 수학
페이지랭크 알고리즘 속의 수학을 한번 알아보자. 구글검색엔진에서는 한 웹페이지에서 다른 웹페이지로 연결하는 링크가 있게되면 그것을 일종의 투표형식으로 본다. 투표수가 많은 웹페이지는 좋은 정보가 있는 사이트라고 가정을 한다. 그리고 검색결과 상단에 배치시킨다. 이것이 페이지랭크 알고리즘 원리이다.
<웹페이지에서 순위를 매기는 방법 4단계>
1단계- 먼저 웹페이지 사이의 연결 관계를 행렬로 나타낸다. 5개의 웹페이지가 있다고 가정하면, 5x5 행렬에 서로간의 연결관계를 숫자 0과 1을 이용하여 표현하게 한다.
2단계- 행렬A의 각 열을, 성분들의 합으로 나누고 새로운 행렬인 H를 만든다. 이것을 '하이퍼링크 행렬'이라고 칭한다. 구체적인 예를 들자면, 행렬A의 1열의 성분의 합은 2이고, 4열은 3이다. 따라서 1열은 1로 4열은 3으로 성분의 값을 나눈다. 그리고 나서 그 다음행렬인 H를 열의 합이 모두 1인 행렬 S로 만드는것이다. 5열은 각 성분을 모두 1/5로 바꾸어서 합이 1이 되도록 한다.
3단계-행렬 S를 이용하여 구글행렬 G를 구한다. 이때 페이지와 브린이 새로 고안한 G=mS+(1-m)E의 식을 쓴다.
여기에서 m은 0.85로 잡았으며, E는 오른쪽과 같다.
4단계-구글행렬G의 고유벡터 중 가장 큰 고유값에 대응하는 벡터값을 구하게 된다. 이것을 '페이지랭크 벡터'라고 칭하는데 이것은 각 웹페이지의 투표수를 말하기도 한다.
구글의 목표는 전세계의 정보담기 프로젝트
구글은2014년 글로벌 브랜드가치 1위를 달성하였으며, 구글의 가치는 돈으로 환산하게 되면 1588억 4300만 달러(한화로 약 163조원)이다. 비교하기 쉽게 말하자면 우리나라 최고의 기업인 삼성전자의 브랜드 가치가 259억달러(약 26조6000억원)인 것을 생각한다면 구글의 영향력은 엄청나다고 할 수 있다.
이러한 구글의 목표는 전세계인의 모든 정보를 관리하는 것이라고 한다. 그것을 누구나 이용할 수 있도록 하며, 이를 위해서 구글 도서관 프로젝트를 현재 진행하고 있다고 한다. 구글은 현재 세계 80곳이상의 도서관들과 3만곳 이상의 출판사와 연계하였으며 현재 지금까지 1600만권 이상을 디지털화 했다고 한다. 이로인하여 수백년전에 쓰여진 원서들을 집에서 구글북스를 통해 무료로 볼수 있게 되었다.
이처럼 구글의 기술은 엄청난 편리성을 제공하였다. 하지만 늘 양지가 있으면 음지도 있는법이다.
자신이 원하지 않는 정보까지 노출되는 문제도 많이 발생하기 때문이다. 이러한 문제와 관련해 법적문제들이 많이 발생하고 있다. 이것은 구글뿐아니라 이시대에서 해결해 나가야할 문제이기도 하다
'미래의 과학' 카테고리의 다른 글
네트워크에 집중하는 과학계 (0) | 2017.10.17 |
---|---|
[미래 컴퓨터] 뇌와 컴퓨터 무선 연결의 세상 (0) | 2017.10.14 |