검색 상세

모바일 RSS리더를 위한 본문 추출기의 설계 및 구현 (SKT, KTF, LGT 이동통신사 공용)

  • 발행기관 서강대학교 정보통신대학원
  • 지도교수 장직현
  • 발행년도 2006
  • 학위수여년월 200608
  • 학위명 석사
  • 학과 및 전공 정보통신대학원
  • 식별자(기타) 000000103299
  • 본문언어 한국어


1980년대 PC혁명이나, 1990년대 인터넷 혁명에 이어 사람들은 2006년, 웹2.0에 주목하고 있다. 웹2.0이란 웹을 표준화 하여 컨텐츠를 공유하고 시멘틱웹을 가능하게 하는 플랫폼인데, 이러한 웹2.0의 핵심사상인 개방성, 이동성, 연결성의 중심에 RSS(Really Simple Syndication)기술이 있다. RSS기술을 이용하여 자신이 원하는 서비스 업체의 컨텐츠를 마치 나의 컨텐츠 처럼 내 홈페이지나 또 다른 블로그에 담을 수 있고, RSS주소를 전문 적으로 수집하는 RSS리더(RSS Reader)를 이용하여 가장 최신의 블로그, 인터넷 쇼핑몰, 인터넷 뉴스의 글을 모아서 볼 수 있게 된 것이다. 모바일 RSS리더(Mobile RSS Reader)는 이러한 RSS리더의 기술을 휴대용 단말기(휴대폰, 스마트폰, PDA)에서 구현한 것으로, 체널 등록, 체널 수정, 체널 삭제 기능을 무선인터넷에 접속하여 활용할 수 있다. 하지만 블로그 및 인터넷 뉴스를 서비스하는 업체들은, 원치 않는 트래픽의 발생 및 자사의 포털사이트를 통한 광고를 할 수 없다 등의 이유로 RSS문서에 본문 전체를 제공 하지 않는 경우가 대부분이다. 이는 웹 환경의 페이지를 자유롭게 드나들 수 없는 모바일 환경에서는 치명적인 제약이다. 이에 본 논문에서는 본문추출기를 설계 구현함으로써 RSS 문서에서 주소(Link) 및 제목(Title), 본문의 내용 일부(Description: 이하 초록)를 수집하고, 수집된 자료를 분석하여 블로그 및 인터넷 뉴스 서비스 본문의 순수 Text를 추출하였다. 또한 추출한 Text를 차세대 유/무선 Markup Language로 부상한 XHTML로 가공 함으로써 SKT, KTF, LGT 모바일 단말기에서 동일하게 서비스 되도록 구현하여 기존의 모바일 RSS리더가 가지는 서비스의 제약을 개선하였다.



Followed by the PC revolution of 1980’s and the internet revolution of 1990’s, people are focusing their attention to Web 2.0 in the year 2006. Web 2.0 is a platform setting up the standard of web to share the content and to make the web semantic while there is an RSS (Really Simple Syndication) technology at the center of openness, mobility and connectivity that are key concepts of such Web 2.0. Using RSS technology, we can post the desired contents of service provider onto our homepage or other blogs as if they’re our contents, or gather texts of the most recent blog, internet shopping malls and internet news to see them all at once using the RSS reader which is specialized in gathering RSS links. Mobile RSS reader is software built inside mobile devices (cellular phone, smart phone, PDA) with the same functions of RSS aggregator that can use register channel, modify channel and delete channel functions by connecting to the wireless internet. But the providers of blogs and internet news do not provide the full text in RSS documents in most cases because of reasons such as creating unwanted traffic or not being able to advertise using the company’s own portal site. This is a fatal limitation in a mobile environment where we can’t go in and out of web pages freely. So in this thesis, the pure text of in the body of blogs and internet news services have been extracted by collecting the link, title and the parts of full text (Description: hereinafter referred to as ‘abstract’) and analyzing the extracted data by designing and building a text extractor. Also, by processing the extracted text with an XHTML that has surfaced as a cable/wireless Markup Language of the next generation, the improvement was made for limitations of services which the existing mobile RSS reader has by building the program to be serviced in a same way in mobile devices of SKT, KTF and LGT.
