

Qrobo.com


사용자는 별도의 프로그램 다운을 받지 않고 포딕스 사이트 내에서 음성을 녹음하고 업로드 할 수 있습니다. 제작된 팟캐스트는 MP3로 다운로드 받거나, 블로그에 플레이어를 복사할 수 있습니다. 그리고 포딕스의 모든 팟캐스트에는 구독할 수 있도록 팟캐스트의 RSS 주소가 자동으로 생성됩니다.
podics.com

Posted by 큐로보





Posted by 큐로보
경기벤처협회 기업탐방 2008.June.Vol.11
○ 우선, 독자들의 이해를 돕기 위해 (주)시맨틱스에 대한 간략한 기업소개를 부탁드립니다.
㈜시맨틱스는 I.I.R.D (Internet Infrastructure Research & Development)를 기본 이념으로 1998년도 부터 검색엔진 원천기술과 관련된 연구&개발을 중심으로 사업을 운영해 왔습니다. 2006년 ㈜시맨틱스는 ‘포탈과 미디어에 대한 도전’이라는 새로운 기업 이념으로 인터넷 다음 시대를 열어갈 기술인 ‘시맨틱 웹(Semantic Web)’ 기술의 표준안 연구와 범용 서비스를 위한 독자적 상용 기술 개발을 해 오고 있습니다.
한국은 IT강국이라는 이름 위에, 이미 세계를 점령한 구글에 대하여도 꿈쩍하지 않는 국내 포탈 같은 강력한 서비스들을 만들어 냈지만, 안타깝게도 원천기술 등의 부족으로 우리의 서비스가 해외로 진출하여 성공한 사례를 찾기가 어려운 상황에 있습니다.
또한, 핵심 수익모델에 대한 원천기술 역시 부족하여 이를테면, 우리가 알고 있는 주요 포탈들의 주 수익원인 검색광고는 미국의 검색광고 솔루션인 오버추어와 구글을 통해 제공되고 있고, 따라서 지금도 매출의 절반 수준이 미국의 글로벌 기업 수익으로 보내지고 있습니다. 사실 지금의 CPC검색광고는 지난 2003년 미국 야후의 오버추어서비스가 오버추어코리아로 국내에 들어오면서부터 국내포탈들에 전해지기 시작하였고, 그 이후로 그러한 시스템하에 한국의 검색광고 시장이 구성되어 있습니다.
이러한 수익모델의 원천기술뿐 아니라, 서비스를 운영하는데 있어서 필요한 원천기술들 역시 부족하기 때문에, 고가의 서버와 네트워크 장비, 고가의 유지비용이 들어가는 O/S와 Database 시스템 등을 IBM, MS, ORACLE같은 글로벌 기업들을 통해 도입해야 합니다.
우리는 이러한 상황이 검색엔진 뿐 아니라 IT 여러 분야에서 나타나고 있다고 판단하고 있으며, 원천기술을 확보하는 과정에 높은 비용의 희생과 상용 서비스 시기의 장기화와 관련된 많은 어려움이 따르지만, 그러한 이유로 많은 회사들이 원천기술 개발보다는 이미 다른 기업이 만들어 놓은 기술 위에서 응용사업에 뛰어 들어 사업 리스크를 최소화 하려고 하기 때문에, 이점이 오히려 벤처기업만이 할 수 있는 강력한 경쟁력이라 생각하고, 회사의 기본이념인 I.I.R.D 아래 가능한 모든 서비스의 원천기술 확보를 최우선 과제로 삼고 있는 기업입니다.
이렇게 운영해 온 결과, 현재 10년 이상의 지속적인 연구개발의 한 성과로서 ‘시맨틱(Semantic)’ 기술 기반의 검색엔진 ‘Qrobo( www.qrobo.com )큐로보' 를 한국어 알파버전 서비스로 운영할 수 있게 되었습니다. 이 큐로보 검색엔진은 한국어 서비스뿐 아니라, 다국어 서비스 또한 진행 중인 검색엔진으로서, 다국어 서비스를 통해 글로벌 검색엔진 서비스를 시도한다는 것은 그 동안 야후, 구글, MS, 알타비스타 처럼 미국 기업만이 할 수 있었다고 여겨졌던 검색엔진 글로벌 시장에 우리가 진출하게 된다는 것을 의미합니다. 글로벌 검색엔진 시장은 미국 외 세계 어느 국가도 시도조차 해보지 못한 분야로서, 우리 회사에서 가장 유쾌한 계획입니다.
또한, 시맨틱스는 서비스에 필요한 각 분야 원천기술들의 확보를 통해 경쟁력을 확보하고 있습니다. 그 중 국제표준인 차세대 인터넷의 핵심이 될 ‘시맨틱 웹(Semantic Web)’을 시맨틱스만의 기업 독자적 상용모델로 완성시켜, 세계 어느 기업도 상용화 서비스로 옮기지 못한 이 기술 기반의 원천기술을 확보하므로, 추론 검색, 의미 검색, 상황 검색, 개인화 검색 등 그 동안 차세대 검색엔진 연구소들이 도입하고자 계획해 왔던 서비스들을 처음으로 상용 서비스하게 됩니다.
또한 2007년 12월에는 ‘엠엔케스트( www.mncast.com )’의 개발 및 서비스사였던 ㈜이니드와 합병하여 최근 국내최초 팟캐스트 서비스인 ‘포딕스( www.podics.com )’를 베타서비스하고 있으며, 이를 통해 엔터테인먼트 및 컨텐츠 분야에서도 시맨틱 원천 기술을 접목해 가고 있습니다. 이러한 동일한 방법으로, 멀티미디어, 뉴스 및 블로그 등 포탈의 주요 핵심기능이 시맨틱 원천기술 기반에서 구성되어 서비스되도록 하고 있으며, 다음 시대의 발전된 포탈서비스를 준비하고 있습니다.
○ 알아본 바로는 (주)시맨틱스에서 개발하고 있는 시맨틱 기반 검색이 구글이나, MS의 라이브닷컴과 같은 키워드 검색엔진을 넘어서는 기술이라고 알고 있습니다. 깊숙한 곳에 있는 데이터까지도 잘 활용할 수 있게 만들어진 시맨틱에 대해 독자들이 쉽게 이해할 수 있도록 설명 부탁 드립니다.
간단히 말해서 ㈜시맨틱스의 차세대 검색엔진 `큐로보` 와 `구글` 등의 차이점은 `의미기반` 과 `키워드기반 `이라는 점입니다. 현재의 키워드기반 검색엔진의 문제점은 검색자의 검색의도와 관계없이, 동일한 키워드가 있는 문서를 찾아 준다는 것입니다.
이를 테면 검색자가 `유비`라는 단어를 검색하면 구글 등은 `유비쿼터스`에 대한 문서들을 함께 보여줍니다. 검색엔진이 `유비` 라는 단어가 삼국지에 나오는 그 `유비`라는 것을 인식하지 못하기 때문입니다. 이러한 이유로 검색자는 다시 검색을 시도하여 `삼국지 유비` 라고 검색어를 두 단어 이상으로 만들어 원하는 결과를 찾게 됩니다. 하지만, 이렇게 검색하는 경우 삼국지라는 말도 반드시 들어가는 문서만을 찾아 주기 때문에 보여줄 수 있는 문서가 제한적이 됩니다.
하나의 예를 더 들면, ‘맨체스터 유나이티드’ 의 열렬한 팬이 그 팀에 관한 글을 거의 논문 수준으로 훌륭하게 썼다고 해도 그 글에 ‘맨체스터 유나이티드’ 라는 단어를 사용하지 않고 작성할 수 도 있는데, 이런 경우, 검색자가 ‘맨체스터 유나이티드’라는 키워드로는 이 문서를 찾을 수 없게 됩니다. 이 문서는 분명 처음부터 끝까지 ‘맨체스터 유나이티드’ 와 관련된 글이지만, 키워드기반의 검색은 단지 동일한 키워드만을 찾아주기 때문입니다.
그러나, 시맨틱 기반의 검색엔진 `큐로보`는 `유비` 가 삼국지의 `유비`라는 것을 이해하고 그 파생과 연관관계까지 추론하여 문서를 보여줍니다. `유비` 라는 한 단어에도, 의미기반 검색엔진은 `유비` 가 문화에서는 삼국지와 관렸 있음을, 스포츠 분야에서는 유상철과도 관련이 있음을, IT 분야에선 유비쿼터스 등 과도 관련이 있음을 이해합니다. 약 1,000 개 이상의 세분화 된 카테고리 속에서 `큐로보`는 검색자의 의도나 성향까지 파악하여 결과를 보여주게 됩니다.
`큐로보`에 탑재된 이 시맨틱 기반 기술과 기존 기술의 주요 차이는 다음 표와 같습니다.
|
|
국내 포탈 |
구글 |
큐로보 |
|
검색기반 |
단어기반 검색 |
단어기반 검색 |
의미기반 검색 |
|
검색결과정렬방법 |
기획자가 중요하다고 판단한 결과가 상위에 출력 |
페이지 랭크Page Rank |
시맨틱 랭크Semantic Rank |
|
시맨틱기술적용 |
R&D중 |
R&D중 |
상용서비스 |
|
온톨로지기술적용 |
R&D중 |
R&D중 |
상용서비스 |
|
개인화검색기술 |
사용자가 수동설정 |
사용자가 수동설정 |
로봇이 자동설정 |
|
언어기반기술 |
한국어기반 |
다국어기반 |
다국어기반 |
|
언어처리기술 |
형태소분석기기반 |
형태소분석기기반 |
수치분석기기반 |
큐로보의 핵심 기술 중 하나인 서브로봇 몇 가지는 다음 표와 같습니다.
|
온토로보 |
(온톨로지기반 단어 자동분석 로봇) 웹 문서 데이터로부터 온톨로지를 자동으로 추출하여 온톨로지 사전을 구축하는 온톨로지 빌더(Ontology Builder)기술로서, 320억 개 이상의 단어를 실시간으로 자동분석 합니다. 온토로보의 핵심기술은 시맨틱 웹으로 작성되지 않은 기존의 웹사이트들로부터 웹데이터를 수집하면서도 마치 시맨틱 웹 사이트에서 수집한 것과 같이 각 데이터 간의 의미관계를 정밀하게 분석하여 검색 결과에 반영하는 기술입니다. 온토로보 기술을 활용하면 기존의 검색엔진에서라면 여러 번에 걸쳐서 검색해야 겨우 찾아낼 수 있는 정보들을 온톨로지 스탭에 의해 쉽게 찾을 수 있습니다. |
|
도큐로보 |
(시맨틱 기반 문서성향 자동분석 로봇) 0.03초 만에 로봇은 웹 문서의 성향을 읽어 1,200여 개 카테고리 중 어디에 속하는 지 자동으로 분석해 냅니다. 예를 들어 최근 한국에서 인기를 끌고 있는 미국드라마 프리즌브레이크를 검색하면 1. 문화>연예>방송 [30%] 2. 문화>영화 [22%] 3. 사회>사건 사고 [20%] 4. 국제>북미 [8%]에 관련이 있는 것으로 분석이 되는 방식입니다. 그렇기 때문에 도큐로보를 이용하면 수 십 년치의 신문기사나, 방치되어 있는 기업의 정리되지 못한 방대한 지식정보 문서들을 자동 분류하여, 문서의 체계적인 검색 시스템을 갖추어 줍니다. |
|
이슈로보 |
검색자가 1998년 IMF당시 뉴스를 검색 하고자 할 때 검색창에 IMF를 치면 로봇이 알아서 년 도별로 검색결과를 분류하여 주기 때문에 그래프상의 년도 표시 포인트를 클릭하면 그 당시의 생생한 뉴스들을 볼 수 있게 됩니다. 또한 년 도별, 월 별, 주간 별,계절 별 등 검색자의 컨셉에 맞춘 자세한 검색도 가능하며 방대한 양의 논문,학술지등을 년도 별로 분류해 놓음으로 소중한 연구결과를 쉽게 찾아낼 수 있습니다. |
|
퍼스널로보 |
(개인화검색 로봇)검색자의 상황정보와 검색성향을 분석하여 개개인에게 딱 맞춘 검색결과를 제공합니다.퍼스널 로보를 이동통신과 연계하면 사용자의 성향을 파악한 퍼스널로보는 이통사에 그 정보를 전달하고 사용자의 위치에서 상요자가 평소 좋아하는 음식,신간 서적 등을 구매할 수 있는 장소를 연결해 주며 두 사용자가 함께 있을 때 퍼스널 로보는 상대사용자의 선호음식,놀거리,좋아할 만한 선물까지 추론하여 주고 장소까지 연결해 주게 됩니다. |
|
태그로보 |
문서태그자동추출기or시맨틱기반 자동태깅 로봇) 웹문서의 핵심에 되는 단어들을 자동으로 추출하여 자동으로 태그를 다는 기술입니다. 문서에 존재하지 않아도 중요한 태그는 자동으로 태그를 생성해 주기 때문에 검색 광고를 하는 기업의 측면에서도 검색 광고 효율을 비약적으로 증가시킨다는 장점이 있습니다. |
○ 현재 우리나라의 온라인 검색엔진은 국내 포탈과 대형 사업자들이 점유하고 있는데요. 이들과 경쟁력을 갖추기 위해 (주)시맨틱스만의 사용자 유치 전략이 있다면 알려주세요.
미국의 야후는 구글이 있기 전, 세계 최고의 검색포탈이었습니다. 어떤 IT전문가도 그러한 야후가 지금처럼 다른 누군가에게 대부분의 시장을 빼앗기리라고는 예상하지 못했을 것입니다. 야후는 초창기의 검색서비스로서 지금과 비교했을 때는 비교도 되지 않는 1/100 수준의 웹 페이지만을 검색하여주는 서비스였습니다. 따라서 큰 기술이 필요하지 않았고, 디렉토리 중심의 검색이 핵심 기능이었습니다. 인터넷이 발전하고 그 사용자와 데이터도 기하급수적으로 늘어나자 더 방대한 양의 검색을 필요로 하였는데, 이 시기에 구글이 등장하게 되고, 사용자들은 새로운 인터넷 시대에 더 잘 어울리는 로봇 검색엔진 구글을 선호하게 되었습니다. 그리고 곧 빠른 시간 안에 야후에 검색서비스를 납품하던 구글은 야후의 자리를 차지하게 됩니다. 이렇게 되기 위해 다양한 사업 전략과 제휴와 마케팅과 자금의 힘이 뒷받침 되었겠지만, 무엇보다도 가장 중요한 것은 구글 검색결과에 대한 만족도였습니다. 반면에, 검색결과의 만족도에 큰 신경을 쓰지 못하고, 자금의 힘으로 제휴와 마케팅에 전력을 기울였던 국내외 일부 포탈들은 이미 사용자들에게 외면당하여, 순위 밖의 서비스로 어렵게 유지하고 있거나 사라져 있는 상태입니다.
즉, 우리는 인터넷 검색이란 이 특별한 상품을, ‘품질은 보통이어도 포장을 잘하면 강력한 마케팅만으로 소비자를 유혹하여 성공할 수 있고, 아무리 잘 만들어도 포장을 잘 못하면 망할 수 있는 제조회사의 상품’ 과 같은 상품으로 보지 않습니다. 또한, 삼성전자, 현대자동차와 같이 오랫동안 신뢰를 주었던 기업의 브랜드 이미지가 이지 시장을 선점하고 있는 경우, 후발주자가 진입하기 어려운 상품이라고도 보지 않습니다. 한국에서도 1등 검색 포탈이었던 야후는 그 세계적인 브랜드 이미지가 아직 구글 보다 우위에 있을 때에도 불구하고, 불과 몇 년 만에, ‘직원 몇 명 사내벤처로 시작한 작았던 네이버’에게 한국시장을 넘겨 주었습니다.
따라서, 지금 큐로보의 가장 중요한 전략은 검색결과의 품질입니다. 아직은 알파서비스 단계이기 때문에 부족한 부분이 많이 있지만, 곧 정식 서비스를 시작하면서 단계별로 계속해서 그 품질이 업그레이드 될 것입니다. 기존 검색엔진들은 기반기술의 업그레이드가 어려운 구조이지만, 큐로보는 처음 설계부터 기술기반 확장성을 중요하게 고려하였기에, 핵심기술이 계속해서 업그레이드 되는 검색엔진이 될 것입니다. 검색엔진과 같은 서비스는 사용자가 직접 체험하면서 서비스의 품질을 판단할 수 있기 때문에, 우리가 시맨틱 기술 기반의 품질 좋은 검색결과를 내 놓을 때, 생각 있는 사용자들부터 시작하여 우리 서비스를 선호하게 될 것이라 확신합니다.
또한, 이 뿐 아니라, 시맨틱스는 블로그 네트워크, 소셜 네트워크, 블로그 위젯 등의 서비스를 매우 중요한 마케팅 서비스라 판단하고 있으며, 이러한 개념을 기본으로 한 유저 유입 마케팅 전략들을 가지고 있습니다. 일예로, 자사의 팟캐스트서비스인 포딕스를 통한 유저 유입 마케팅과 대형포탈 및 커뮤니티 서비스에의 큐로보 시맨틱 기술 적용으로 큐로보 검색에 익숙한 환경을 조성해 나가고 있으며, 이미 파란과 팍스넷 에이빙넷과의 제휴협력을 통해 큐로보 기술을 일부 적용하고자 각 사에 맞게 시맨틱 기술 기반의 도구들을 개발 중입니다.
○ 조광현 대표님께서 소프트웨어 분야의 사업을 시작하시게 된 계기가 궁금합니다. 더불어 이 분야에서 벤처기업을 운영하시는데 있어 가장 중요하게 생각하시는 부분에 대해서도 알고 싶습니다.
사람은 잠을 자야 하고, 큰 일을 하기 위해서는 많은 사람들이 협업을 해야 합니다. 그리고, 그렇게 일하기 위해서는 많은 비용이 필요합니다. 하지만, 이 ‘소프트웨어 에이전트(Software Agent)’를 이용한다면, 수 많은 사람들이 함께 오랫동안 협업을 하여도 이루어 낼 수 없는 일들을 만들 수 있습니다. 사람의 힘으로는 상상도 할 수 없는 일들을 해내는 것이 이 ‘소프트웨어 에이전트(Software Agent)’ 입니다. 그리고, 이 에이전트는 잠도 자지 않습니다. 전기만 있으면 어디서든 쉬지 않고 생각하여 결과를 냅니다. 저는 지금도 자는 시간과 식사 시간을 아깝게 생각하는데, 잠자는 것보다 그리고 먹는 것보다도 더 즐거운 일이 바로 생각하는 시간이기 때문입니다. 그래서, 오랫동안 평균 수면시간은 3-4시간이고, 가족과 함께하는 식사시간 외에는 대부분 간편하게 빨리 할 수 있는 방법을 선택합니다. 그런데, 이 ‘소프트웨어 에이전트(Software Agent)’가 잠을 자고 있는 시간에도 나 대신 생각을 계속 하고, 그것도 수 많은 사본들이 서로 다른 생각들을 쉬지 않고 해주고 있으니 이 매력에 빠지지 않을 수가 없습니다.
더욱이, 로봇(Robot) 또는 에이전트(Agent)라고 불리는 우리가 만들고 있는 이 소프트웨어 에이전트(Software agent)분야는 개발에 한계가 없습니다. 모든 분야에서 모든 학문을 이용하여 만들어지는 분야가 바로 이 분야입니다. 희귀병을 치료하는 치료방법을 연구하기 위해서도 이 에이전트를 사용해야 하고, 행성을 탐사하는 로봇도 이 에이전트를 사용해야 하며, 폭풍이나 지진과 같은 재난을 예보하기 위해서도 이 에이전트를 사용해야 합니다. 지금은 이 소프트웨어 에이전트 기술을 검색엔진에 적용하고 있지만, 이 분야에서 기반을 갖추게 된다면 아직 시도되지 못한 첨단 분야에서 이 소프트웨어 에이전트 기술을 적용하는 연구개발을 시작하게 되기를 희망하고 있습니다. 또한 이 분야의 벤처기업 운영에 있어서 무엇보다도 임직원 모두가 이러한 핵심동력을 가지고 있어야 한다고 생각하며, 우리 시맨틱스의 가장 큰 장점 중 하나는 바로 그 점입니다.
○ 각고의 노력 끝에 개발한 소프트웨어 보안의 중요성은 두말할 필요가 없을 것입니다. 소프트웨어 개발의 핵심이기도 한 기술 보안을 위해 어떠한 노력을 기울이는지 알려주세요.
(보유한 특허에 대한 내용을 언급하셔도 좋습니다.)
시맨틱스는 1,000여대의 핵심서버를 관리하기 위해, 이원화로 운영하고 있습니다. 보안이 중요한 핵심개발 서버들은 사내에 IDC 시설을 구축하여 직접 운영하고 있으며, 서비스를 위한 서버들은 분당과 강남 그리고 구로 3곳의 IDC에 각 그 기능별로 분산하여 운영하고 있습니다. 또한, 모든 사무공간은 보안을 2중화 하고, 지문인식시스템과 화상확인시스템을 통해 외부인의 출입을 철저히 통제하고 있고, 각종 문서들은 보안등급제로 관리하고 있습니다. 또한, 개발 소스의 보안을 위하여, 특정 한 파트에서 가지고 있는 소스로는 핵심 소스를 생각해 내거나 접근하지 못하도록 각 파트의 접속이 철저히 분리되어 개발되고 있습니다.
모든 핵심 기술은 자체 개발한 것이며, 아래와 같은 기술들에 특허가 적용되어 있습니다.
온톨로지 자동구축 솔루션
시맨틱 자동구축 솔루션
온톨로지 추론 검색엔진
개인화 온톨로지 검색엔진
추론 검색키워드 광고 시스템
시맨틱 게더링 시스템
언어독립형 에이전트 수학 형태소 분석기
시맨틱을 보고서 시스템
문장을 활용한 온톨로지
온톨로지 번역기
쇼핑몰을 위한 온톨로지
온톨로지를 이용한 시맨틱 페이지 분류시스템
휴대 통신기기를 활용한 시맨틱 시스템
시맨틱을 이용한 소셜네트워크 시스템
Posted by 큐로보