본문 바로가기

전체 글155

Day 3. 1. 이진수의 음수 표현 10진 음의 정수를 2진수로 변환하려면, 먼저 10진 음의 정수의 절대값을 2진수로 변환한다. 그 다음에 2진수의 '2의 보수'를 구하면 된다. 예를 들어 '-6'의 2진 표현을 구하는 과정은 다음과 같다. //-6 ----> 6 ----> 0110 ----> 1010 // 절대값 2진수 2의보수 2. 보수 2의 보수법(2's complement) 어떤 수의 'n의 보수'는 더했을 때 n이 되는 수를 말한다. 7의 '10의 보수'는 3이고, 3의 '10의 보수'는 7이다. 3과 7은 '10의 보수의 관계'에 있다고 한다. '2의 보수 관계' 역시, 더해서 2가 되는 두 수의 관계를 말하며 10진수 2는 2진수로 '10'이다. 2진수로 '10'은 자리올림이 발생하고 0이 되는 수를.. 2022. 1. 4.
기존 데이터와 빅데이터를 처리하는 방법의 차이점 Q . 기존 데이터와 빅데이터를 처리하는 방법의 차이점을 자세히 설명하세요. 크기 기존 데이터 세트는 일반적으로 기가바이트와 테라바이트 단위로 측정됩니다. 따라서, 서버 한 대에도 중앙 집중식 스토리지를 사용할 수 있습니다. 빅데이터는 크기뿐만 아니라 볼륨으로도 구분됩니다. 빅데이터는 일반적으로 페타바이트, 제타바이트 또는 엑사바이트 단위로 측정됩니다. 점점 더 커지는 빅데이터 세트의 규모는 현대적인 고용량 클라우드 기반 데이터 스토리지 솔루션에 대한 수요를 뒷받침하는 주요 요소 중 하나입니다. 구성 전통적인 데이터는 일반적으로 레코드, 파일 및 테이블로 구성된 정형 데이터입니다. 기존 데이터 세트의 필드는 관계형이므로 서로의 관계를 파악하고 그에 따라 데이터를 조작할 수 있습니다. SQL, Oracle.. 2022. 1. 4.
텍스트 마이닝 기술의 절차 Q . 텍스트 마이닝 기술의 절차를 설명하세요. 텍스트 마이닝 절차 비정형 텍스트 데이터는 대체로 API 호출, 크롤링 등의 방법에 따라 수집됩니다. API 호출이든 크롤링이든 비정형 텍스트 데이터가 수집이 되었다면, 본격적인 텍스트 마이닝 절차에 들어가게 됩니다. 그중 첫 번째 절차는 수집된 텍스트 데이터의 형태소 분석 혹은 토큰화입니다. 형태소(morpheme)란 의미를 가지는 최소 단위 단어로서 더 이상 두 개 이상의 의미를 가지는 단어로 나눌 수 없는 말 그대로 의미를 가지는 최소 단어 단위입니다. 또한 문서 혹은 문장을 이러한 형태소로 구분하는 과정을 토큰화라고도 합니다. 텍스트 마이닝에서 형태소 분석은 형태소 자체를 분석하는 것이 아니라 텍스트를 형태소로 구분하여 분석하는 것을 뜻합니다. 영어.. 2022. 1. 4.
Day 2-2. 1. 진법 진법이란 수를 표기하는 기수법의 하나로 임의의 숫자를 사용하여 수를 표현하는 방법입니다. 우리가 일반적으로 사용하는 0부터 9까지의 숫자를 사용하여 수를 나타내는 방법을 10진법이라고 부릅니다. 현재 프로그래밍에서 많이 사용되는 진법은 2진법, 8진법, 10진법, 16진법으로 총 4가지 입니다. 2진법(binary notation) 2진법은 0과 1, 두 개의 숫자만으로 수를 표현하는 방법입니다. 컴퓨터 논리회로에서 사용하는 단위로 0, 1로 구성됩니다. 이러한 2진수 자릿값이 올라감에 따라 그 크리가 2배만큼 커집니다. 더보기 컴퓨터에서는 2진수의 한 자리를 비트(bit)라는 용어를 사용하여 가리키며, 이러한 비트가 8개 모여 1바이트(byte)를 구성합니다. 8진법(octal notatio.. 2022. 1. 3.