본문 바로가기

R언어2

오피니언마이닝 기술 적용 Q . 빅데이터의 처리과정은 데이터 소스 – 수집 – 저장 – 처리 – 분석 – 시각화의 절차로 진행됩니다. 이와 같은 절차를 기반으로 스마트폰을 구매한 소비자의 상품평 댓글을 기반으로 플랫폼에 오피니언마이닝 기술을 적용하고자 할 때 각 스텝별 구축 방법론을 제시하세요. 데이터 소스 웹 페이지에 있는 특정 스마트폰을 구매한 소비자의 상품평 댓글이 데이터 소스에 해당 됩니다. 데이터는 방정형 데이터로 스크립트 파일 저장 형태를 가지고 있고, 활용 API로는 브라우저, 응용소프트웨어(JAVA, DBMS)가 있습니다. 수집 웹 크롤링을 이용하여 소비자의 상품평 댓글이 적혀 있는 인터넷 상의 웹페이지에서 데이터를 수집해서 분류하고 저장합니다. 크롤링은 데이터의 수집보다 여러 웹페이지를 돌아다닌다는 뜻이 강합니다.. 2022. 1. 4.
텍스트 마이닝 기술의 절차 Q . 텍스트 마이닝 기술의 절차를 설명하세요. 텍스트 마이닝 절차 비정형 텍스트 데이터는 대체로 API 호출, 크롤링 등의 방법에 따라 수집됩니다. API 호출이든 크롤링이든 비정형 텍스트 데이터가 수집이 되었다면, 본격적인 텍스트 마이닝 절차에 들어가게 됩니다. 그중 첫 번째 절차는 수집된 텍스트 데이터의 형태소 분석 혹은 토큰화입니다. 형태소(morpheme)란 의미를 가지는 최소 단위 단어로서 더 이상 두 개 이상의 의미를 가지는 단어로 나눌 수 없는 말 그대로 의미를 가지는 최소 단어 단위입니다. 또한 문서 혹은 문장을 이러한 형태소로 구분하는 과정을 토큰화라고도 합니다. 텍스트 마이닝에서 형태소 분석은 형태소 자체를 분석하는 것이 아니라 텍스트를 형태소로 구분하여 분석하는 것을 뜻합니다. 영어.. 2022. 1. 4.