Loading...

텍스트마이닝(Text Mining)과 정보검색(information retrieval)이란?

1. text mining KDD,WSDM,ICWSM,CIKM 등에서 연구 선도 빅데이터 분석의 한 종류 대규모의 텍스트 데이터로부터, 예를 들면 과거 1년간 몇백만건의 뉴스기사를 모아 거기서 나타난 뉴스들의 키워드를 시간순으로 나열하여 (AI트렌드,상품트렌드)트렌드를 분석함 혹은 유명인의 이미지 변화를 분석함 회사에서 출시한 상품에 관한 리뷰들을 키워드로 분석하여 소비자 반응을 알아봄 서로 다른 단어지만 비슷한 의미를 가지는 키워드들을 그룹화한 document clustering, topic modeling sns 빅데이터를 분석하여 신조어 현황을 파악하여 사회 전반적인 현상을 파악, social science에 대한 insight를 얻음 예를 들어 sns에 ‘혼밥’이라는 단어가 다수 등장한다는 것은 ..

2022. 1. 23. 23:44

달팽이 배열로 숫자 채워넣기

1. 문제 https://programmers.co.kr/learn/courses/30/lessons/68645?language=python3 코딩테스트 연습 - 삼각 달팽이 5 [1,2,12,3,13,11,4,14,15,10,5,6,7,8,9] 6 [1,2,15,3,16,14,4,17,21,13,5,18,19,20,12,6,7,8,9,10,11] programmers.co.kr 정수 n이 매개변수로 주어집니다. 다음 그림과 같이 밑변의 길이와 높이가 n인 삼각형에서 맨 위 꼭짓점부터 반시계 방향으로 달팽이 채우기를 진행한 후, 첫 행부터 마지막 행까지 모두 순서대로 합친 새로운 배열을 return하도록 solution함수를 완성하세요. 2. 제한사항 n은 1 이상 1000이하 3. 예시 4. 나의 풀이..

2022. 1. 23. 19:59

파이썬(Python) 프로그래밍 가이드라인

import black을 이용하면 PEP8에 맞는 기준 관례 코드로 수정해줌 1. 기본적인 관례 함수는 프로그램의 공통적인 부분이나 복잡한 부분을 함수화시켜 사용하는 것 가능하면 함수 내부는 짧게 작성 함수 이름은 함수 역할을 명시하게 작성 함수와 함수사이는 두줄 띄어씀 함수는 프로그램 맨 위에 작성 대소문자 I,O,i,o는 자제하는게 좋음, 0이랑 1, l과 헷갈림 불필요하게 많은 공백을 작성하는 것은 자제 연산자 안밖으로는 1칸만 띄어쓰는거( 1 + 2 = 3 vs. 1 + 2 = 3) 들여쓰기는 tab보다는 4칸 띄어쓰기(space) 함수명은 되도록 소문자 for문의 순회문자는 i,j,k...가 관례 iteration은 0부터 시작하는 것이 관례 사람이 이해할 수 있는 변수명을 사용하는 것이 중요함..

2022. 1. 23. 18:44

Computer Vision을 어떻게 구현할까?

1. computer vision을 어떻게 구현할까 앞에서 설명한 아이디어를 바탕으로 computer vision을 구현하는 것은 machine visual perception을 구현하는 것 그 입력으로 실제 세상의 한 모습인 이미지나 비디오같은 visual data를 주는 것이다. visual perception의 종류는? 색깔 인지, 움직임 인지, 사회적 감각 인지 등등 많다 사람의 시각능력을 biological하게 이해하고 이것을 어떤 식으로 구현할지 알고리즘을 연구하는 것도 포함한다 2. 우리의 시각능력은 사실 불완전하다 우리 시각은 단순히 시력이 나쁜 것 말고도 평소에 느끼기 어려운 치명적인 불완전성이 있을 수 있다 이렇게 거꾸로 선 사람을 보면 못생겨보여도 큰 위화감이 안든다 근데 똑바로 세우..

2022. 1. 21. 21:20

규칙을 찾는 알고리즘 문제

1. 문제 https://programmers.co.kr/learn/courses/30/lessons/84512 코딩테스트 연습 - 모음사전 사전에 알파벳 모음 'A', 'E', 'I', 'O', 'U'만을 사용하여 만들 수 있는, 길이 5 이하의 모든 단어가 수록되어 있습니다. 사전에서 첫 번째 단어는 "A"이고, 그다음은 "AA"이며, 마지막 단어는 "UUUUU"입니 programmers.co.kr 사전에 알파벳 모음 ‘A’,’E’,’I’,’O’,’U’만을 사용하여 만들 수 있는 길이 5 이하의 모든 단어가 수록되어 있다 사전에서 첫번째 단어는 ‘A’이고 그 다음은 ‘AA’이며 마지막은 ‘UUUUU’이다 단어 하나 word가 매개변수로 주어질 때 이 단어가 사전에서 몇 번째 단어인지 return하도록..

반드시 기억해야하는 파이썬 indexing 특징

a[3:-3]? a = [1,2,3,4,5,6] result = [a[i:j] for i in range(1,4) for j in range(-3,-1)] cnt = 0 for element in result: if len(element)