본문 바로가기
컴퓨터개론

빅데이터란?

by seung_nari 2022. 6. 16.

빅데이터란?

https://www.ksakosmos.com/post/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%88%98%ED%95%99%EC%9D%84-%ED%95%98%EB%8B%A4

양(volume)이 매우 많고, 증가 속도(velocity)가 빠르며, 종류(variety)가 매우 다양한 데이터를 말합니다.

이것을 3V라고도 합니다.

 

빅데이터의 3대 요소(3V)

양(volume)

데이터의 양이 중요합니다. 빅 데이터를 사용하면 저밀도 비정형 데이터를 대량으로 처리해야 합니다. Twitter 데이터 피드, 웹 페이지나 모바일 앱의 클릭 스트림, 센서 지원 장비와 같이 알려지지 않은 값의 데이터가 여기에 해당될 수 있습니다. 일부 조직의 경우, 데이터 양이 수십 테라바이트가 될 수 있습니다. 아니면 수백 페타바이트가 될 수 있습니다.

 

속도(velocity)

속도는 데이터가 얼마나 빨리 수신 및 처리되는가를 나타냅니다. 일반적으로 데이터를 디스크에 기록하는 것보다 메모리로 직접 스트리밍할 때 속도가 가장 빠릅니다. 일부 인터넷 지원 스마트 제품은 실시간 또는 거의 실시간으로 작동하기 때문에 실시간 평가 및 조치가 필요합니다.

 

종류(variety)

종류란 사용 가능한 데이터의 유형 수를 나타냅니다. 전통적인 데이터 유형은 정형화되어 관계형 데이터베이스에 적합했습니다. 빅 데이터의 등장으로 새로운 비정형 유형의 데이터가 나타났습니다. 텍스트, 오디오 및 비디오 같은 비정형 및 반정형 데이터 유형은 의미를 도출하고 메타 데이터를 지원하기 위해 추가로 전처리가 필요합니다.

 

빅 데이터의 가치와 진실

지난 몇 년 동안 두 개의 V가 더 등장했습니다. 값(value)과 정확성(veracity)이 바로 그것입니다. 데이터는 내재적 가치를 가집니다. 그러나 가치는 발견이 되기 전까지는 무용지물입니다. 이와 똑같이 중요한 것이 있습니다. 데이터가 얼마나 진실하며 얼마나 신뢰할 수 있는가입니다.

 

오늘날에는 빅데이터가 자본이 되었습니다. 큰 기업들은 이용자들이 제공하는 데이터를 통해 효율성을 높이고 신제품을 개발하기 위해 데이터를 지속적으로 분석하고 있습니다.

 

최근의 기술 혁신으로 데이터 스토리지 및 컴퓨팅 비용이 대폭 감소하면서 이전보다 더 많은 데이터를 보다 쉽고 저렴하게 저장할 수 있게 되었습니다. 더 많은 양의 빅 데이터를 보다 저렴하고 손쉽게 액세스할 수 있게 되면서 보다 정확하고 정밀하게 비즈니스 결정을 내릴 수 있게 되었습니다.

 

빅데이터에서 가치를 찾는 것은 단순히 데이터를 분석하는 일이 아닙니다(분석은 완전히 다른 이점을 제공). 통찰력 있는 분석가, 비즈니스 사용자 및 경영진이 올바른 질문을 던지고, 패턴을 인식하고, 정보에 입각한 가정을 세우고, 행동을 예측해야 하는 전체적인 발견 프로세스입니다.

 

빅데이터 이점 :

  • 빅데이터를 사용하면 더 많은 정보를 확보할 수 있기 대문에 보다 완벽한 답을 얻을 수 있습니다.
  • 답이 완벽하다는 것은 데이터의 신뢰성이 높아진다는 의미입니다. 따라서 문제 해결에 대한 완전히 다른 접근 방식이 가능합니다.

 

빅데이터 사용 사례

  • 제품 개발 : Netflix 및 Procter, Gamble 같은 회사들은 빅 데이터를 사용하여 고객 수요를 예측합니다. 그리고 과거 및 현재의 제품/서비스의 주요 속성을 분류하고 이러한 속성과 옵션의 상업적 성공 간의 관계를 모델링하여 새로운 제품 및 서비스에 대한 예측 모델을 구축하고 있습니다. 또한 P&G는 포커스 그룹, 소셜 미디어, 테스트 시장 및 초기 매장 출시에서 나온 데이터 및 분석 결과를 사용하여 신제품을 계획, 생산 및 출시하고 있습니다.

 

  • 예측적 유지 보수 : 기계 고장을 예측할 수 있는 요인들이 장비의 연도, 제조업체, 모델과 같은 정형 데이터 뿐만 아니라 수백만 개의 로그 항목, 센서 데이터, 오류 메시지 및 엔진 온도를 포괄하는 비정형 데이터에 깊이 묻혀 있을 수 있습니다. 조직들은 문제가 발생하기 전에 잠재적 문제에 대한 이러한 징후들을 분석함으로써 유지 보수를 보다 비용 효율적으로 배치하고 부품 및 장비 가동 시간을 최대화할 수 있습니다.

 

  • 고객 경험 : 고객을 둘러싼 경쟁이 계속되고 있습니다. 고객 경험을 명확하게 파악하는 것이 그 어느 때보다 가능해졌습니다. 빅 데이터를 사용하면 소셜 미디어, 웹 방문, 통화 기록 및 기타 소스에서 데이터를 수집하여 상호 작용 경험을 개선하고 제공되는 가치를 극대화할 수 있습니다. 맞춤형 옵션 제공을 시작하고 고객 이탈을 줄이며 문제를 사전에 처리할 수 있습니다.

 

  • 사기 및 규정 준수 : 보안과 관련하여 몇 명의 불량 해커만이 아니라 전체 전문가 팀과 싸워야 합니다. 보안 환경 및 규정 준수 요구사항은 계속해서 진화하고 있습니다. 빅 데이터를 사용하면 데이터에서 사기를 나타내는 패턴을 식별하고 대량의 정보를 집계하여 규제 보고를 훨씬 빠르게 할 수 있습니다.

 

  • 머신 러닝 : 머신 러닝은 현재 가장 주목 받는 주제입니다. 데이터, 특히 빅 데이터는 그 이유 중 하나입니다. 이제는 프로그래밍을 하는 대신에 머신을 훈련시킬 수 있게 되었습니다. 빅 데이터를 사용해 머신 러닝 모델을 훈련한 덕분에 다음과 같은 것들이 가능해졌습니다.

 

  • 운영 효율성 : 운영 효율성이 항상 뉴스거리가 되는 것은 아니지만, 빅 데이터가 가장 큰 영향을 미치는 영역입니다. 빅 데이터를 사용하면 생산, 고객 피드백 및 반품, 기타 요인을 분석하고 평가하여 중단을 줄이고 향후 수요를 예측할 수 있습니다. 빅 데이터는 현재 시장 수요에 따라 의사 결정을 개선하는 데 사용할 수도 있습니다.

 

  • 혁신 주도 : 빅 데이터는 사람, 기관, 엔터티 및 프로세스 간의 상호 종속성을 연구한 다음, 이러한 통찰력을 사용하는 새로운 방법을 결정함으로써 혁신을 도울 수 있습니다. 데이터 통찰력을 사용하여 재무 및 계획 고려 사항에 대한 결정을 개선할 수 있습니다. 트렌드와 고객이 원하는 새로운 제품 및 서비스를 조사할 수 있습니다. 동적인 가격 모델을 구현할 수 있습니다. 가능성은 무궁무진합니다.

 

 

 

출처 :

https://www.oracle.com/kr/big-data/what-is-big-data/

'컴퓨터개론' 카테고리의 다른 글

블록체인 BlockChain  (0) 2022.06.16
인공 지능 AI, 머신 러닝, 딥 러닝  (0) 2022.06.16
웹(World Wide Web, WWW)  (0) 2022.06.15
ERD (Entity Relationship Diagram)  (0) 2022.06.15
UML 다이어그램  (0) 2022.06.15

댓글