본문 바로가기

분류 전체보기

지도학습-Supervised learning y의 형태가 입실론에 의해 변형된 값이라 가정 차중량에 따른 차 모델의 연비는 얼마였는가를 스캐터 플롯으로 확인하고, 최우도에 따른 선형그래프를 발견, 문제는 7이상이 되면 음수값이 나오는 것이 문제 2차함수로 변형했을 때는 5이상에서 값이 오히려 증가되는 문제따라서 어떤게 맞는지 모델선택이 필요해 진다. 더보기
KAISTk: KCS470 인공지능과 기계학습-2 기초 다변량 확률론주변확률분포 : 확률계산시 주변부에 계산되는 확률값이라는 유래가 있음. 베이즈룰은 라이클리후드 * 프라이어 1974 미국 모터트렌드 잡지에서 추출한 31개 데이터 엔진에 마력수를 안다면 실린더에 갯수는? 더보기
[K-MOOC] KAISTk: KCS470 인공지능과 기계학습 기초확률론 확률의 정의표본공간(sample space) : 확률실험으로부터 관측될 수 있는 모든 산출의 집합사건공간(event space) :모든사건들의 집합확률은 0보다 크고전체 표본공간은 1이고서로 교집합이0인 베타적인 사건에 대하여 확률은 독립된 사건의 합이다.예제6면을 갖는 주사위를 한번 던질때, 표본공간(집합)은 원소를 6개 가지게 된다.사건공간의 조건, 공집합이 사건공간의 들어가 있을것사건 A는 사건공간안에 들어가 있을 것사건의 합이 전체 표본 공간을 구성할 것짝수 / 홀수 2이하 확률 : 표본공간에서 실수로 만족시키는 값(이벤트 집합이 몇개의 집합을 갖느냐, 갯수* 총표본공간의 아웃풋의 수).. 확률변수 정의예제 1: 이산 확률 변수 : 동전을 10번 던졌을 때 앞면이 나온 횟수예제2: 연속.. 더보기
PSY-DADDY PSY-DADDY 더보기
Introductory Data Science and Big Data Courses Introductory Data Science and Big Data Courses Introduction to Big Data for Business ManagersIntroduction to Big Data Technologies for IT ManagersIntroduction to Data Science for Business AnalystsIntroduction to Data Science for Senior ExecutivesIntroduction to Predictive AnalyticsIntroduction to Statistical Analysis with RIntroduction to NoSQL and Polyglot PersistencyIntroduction to Machine Lea.. 더보기
The Little List of Free #DataScience Courses The Little List of Free #DataScience CoursesFree Online Data Science Courses & Data Science TrainingClick on the free data science courses links below:The Open Source Data Science MastersHarvard CS109 Data ScienceIntroduction to Data Science by Jeff Hammerbacher at UC, BerkeleyIntroduction to Data Science @courseraIntroduction to Data Science @UofWashingtonData Science Course @ColumbiaUni notes .. 더보기
dataquest.io https://www.dataquest.io/mission/1/python-basics/ 더보기
데이터과학 자료모음 데이터 수집http://en.wikipedia.org/wiki/Sample_size_determinationhttp://en.wikipedia.org/wiki/Design_of_experiments데이터 준비How to share data with a statisticianTidy Data 주어진 데이터를 분석에 용이한 형태로 변형하는 것에 대한 Hadley교수의 논문과 R패키지데이터 분석Simply Statistics 통계 관련 유명 블로그StatBlogs 통계 블로그 모음KDNuggets 데이터마이닝 관련 커뮤니티 포탈D3 Visualization of Confidence Interval 이외에도 많은 통개 개념에 대한 시각화를 제공Conf. interval vs. Hypothesis Testing .. 더보기
데이터과학 도구의 사용법을 익히기 위한 자료 R우선 R을 시작하려는 독자들은 다음 웹사이트에서 도움을 받을 수 있다. 특히 첫번째 자료는 엑셀 사용자가운데 R을 시작하는 사람을 위한 책이다. (1장 제공)http://www.rforexcelusers.com/book/prefacehttp://www.statmethods.net/R을 실제로 사용하다보면 필요한 함수나 문법을 찾느라 많은 시간을 소비하게 된다. 이럴때 유용한 것이 자주 사용하는 기능을 한두장에 요약해놓은 Cheatsheet다. R을 자주 사용한다면 꼭 출력해서 보관하도록 하자.R Short Reference CardRStudio R CheatsheetsR Data Mining Reference CardR을 제대로 공부하기 위해서는 아래 분야별 서적을 탐독하도록 하자. 첫 세권은 Lean.. 더보기
손에 잡히는 데이터 과학 이야기_김진영_MS_BIng_검색엔진_연구자 필자는(LiFiDeA / 김진영) 컴퓨터 사이언스 (정보 검색) 전공으로 미국 메사추세츠 주립대에서 박사학위를 받고 2012년부터 미국 마이크로소프트 본사의 빙(Bing) 검색엔진 부문의 연구자로 일하고 있다. 회사에서 검색 품질을 평가하는 일을 담당하며, 사내에서 신입사원을 상대로 업무에서 활용할 수 있는 데이터 과학을 가르치기도 하였다.개인적으로 삶의 생산성과 행복도를 높일 수 있는 다양한 측정 방법을 개발하여 사용하고 있고, 최근에 이런 활동이 Seattle Times에서 보도되기도 하였다. 정보 검색, 기계 학습, 측정 등을 주제로 한 개인 블로그를 수년간 운영하고 있으며, 정보 검색 분야에서 열편 이상의 국제 학회지 논문의 저자이기도 하다.미국에 오기 전에는 서울대학교 전기공학부 학사를 마쳤으며.. 더보기