반응형
반응형
본문 바로가기

인공지능6

블로그 댓글 개수 예측하기(using Random Forest) 블로그 댓글 개수 예측하기(using Random Forest) Blog Feedback Prediction 데이터 셋 출처 : https://archive.ics.uci.edu/ml/datasets/BlogFeedback 1. project description (프로젝트 개요) - problem statement 문제정의 : 지난 72시간 동안 올라온 블로그 글을 분석하여 24시간 이후 블로그에 달릴 댓글의 개수를 예측합니다. - motivation : 블로그 포스트를 이용하여 소셜 미디어 마케팅을 위한 가능한 인사이트를 얻는다. - method : 선형 회귀와 앙상블 학습 모델을 이용하여 블로그에 달릴 댓글의 개수를 예측합니다. 그리고 모델들의 효율을 R2와 평균 제곱오차 (MSE; mean squ.. 2021. 1. 13.
클린코드 (Clean Code) 3장 (함수) 독후감 클린코드 3장 독후감 Chapter 3. 함수 3.1 작게 만들어라 - 함수를 만드는 첫 번째 규칙은 작게 만드는 것이고, 두 번째 규칙은 더 작게 만드는 것이다. 3.2 한 가지만 해라 - 함수는 한 가지만 해야 한다. 3.3 함수 당 추상화 수준은 하나로 - 함수가 한 가지 작업만 하려면 함수 내 모든 문장이 동일한 추상화 수준에 있어야 한다. '위에서 아래로 코드 읽기: 내려가기 규칙'을 지켜야 한다. 3.4 Switch 문 3.5 서술적인 이름을 사용하라 - 함수의 이름이 서술적이고 긴 것이 무식하게 짧은 것보다 좋다. 함수 이름을 짓는 데에 시간을 들여도 좋다. 3.6 함수 인수 - 함수에서 가장 이상적인 인수 개수는 0개이다. 한 함수에 인수 4개 이상은 필요 없다. 3.7 부수 효과를 일으키.. 2020. 12. 28.
파킨스 텔레모니터링 데이터 셋 분석과 모델 훈련 (feat. 랜덤 포레스트) 파킨스 텔레모니터링 데이터 셋 분석 (Parkins Telemonitoring Data Set Analysis and Model Training) 데이터 셋 (Data Set) 목표 : predict the values for motor_UPDRS and total_UPDRS 데이터 셋은 옥스포드 대학의 Athanasios Tsanas와 Max Little이 음성 신호를 녹음하기 위해 원격 모니터링 장치를 개발한 미국 및 인텔의 10개 의료 센터와 협력하여 만들었습니다. 원래 연구는 UPDRS 임상의사의 파킨슨병 증상 점수를 예측하기 위해 다양한 선형 및 비선형 회귀 방법을 사용했다. 출처 : archive.ics.uci.edu/ml/datasets/Parkinsons+Telemonitoring 데이터 .. 2020. 12. 23.
BlogFeedback 피쳐셀렉션 (Feature Selection) (feat. Lasso, Ridge) BlogFeedback 피쳐셀렉션 (Feature Selection) (feat. Lasso, Ridge) 데이터 셋 (Data Set) 출처 (Source) : archive.ics.uci.edu/ml/datasets/BlogFeedback 열이 218개가 있을 정도로 아주 큰 데이터입니다. 데이터를 이루는 각 열의 attribute를 확인하겠습니다. 열이 281개로 이렇게 많은 데이터 셋은 다뤄본 적이 없는데 처음에 많이 당황했습니다. 그래도 각 열에 대한 설명이 있기 때문에 다행이네요. 이렇게 열이 많이 있을 때 어떤 columns를 이용해서 마지막 열인 댓글 수를 예측해야 할 지 모릅니다. 그러므로, 우리는 마지막 열과 상관관계가 높은 열들만 골라서 예측을 진행해볼 것입니다. 그리고 우리는 이것을.. 2020. 12. 21.
QSAR Aquatic Toxicity LC50 예측 (feat. TPOT) QSAR Aquatic Toxicity 순서 1. 데이터 셋 설명 2. 브루트 포스 접근 3. TPOT (Tree-based Pipeline Optimization Tool) 데이터 셋 데이터 셋 다운로드 링크 : https://archive.ics.uci.edu/ml/machine-learning-databases/00505/ 2019년 09월 23일에 UCI Machine Learning Repository에 등록된 나름 최근에 등록된 데이터 셋입니다. 밀라노에 위치한 대학 QSAR 연구 그룹에서 제작된 데이터 셋입니다. 데이터 셋 정보를 보겠습니다. 데이터 셋 정보를 읽어보면 이 데이터 셋은 Daphnia Magna에 대한 acute toxicity (급성 수생 독성)을 예측하기 위해 908개 화학.. 2020. 12. 20.
ML/DL for Everyone with PyTorch (Sung Kim) #01 ML/DL for Everyone with PyTorch (Sung Kim) - Overview www.youtube.com/watch?v=SKq-pmkekTk&list=PLlMkM4tgfjnJ3I-dbhO9JTw7gNty6o_2m&ab_channel=SungKim Code: https://github.com/hunkim/PyTorchZero... Slides: http://bit.ly/PyTorchZeroAll Videos: http://bit.ly/PyTorchVideo hunkim.github.io/ml/ 모두를 위한 머신러닝/딥러닝 강의 hunkim.github.io 2020. 12. 13.

반응형