본문 바로가기

강연 & 세미나

The 11th Advanced Computing Conference #5 다음 유창국 국장

세션#5 다음 유창국 국장





다음의 데이터 분석 활용

쿼리에 따른 검색결과 배치

방금 그곡 서비스, 자사의 데이터 DB 와 유사한 가를 찾아서 서비스

쿼리와 문서의 상관관계를 순서대로 보여줌, 따라서 쿼리에 집중

디스플레이 광고에서는 검색과 다르게 접근, 사용자 관심사에 집중

모바일 다음 웹에서는 뉴스와 같은 컨텐츠만 사용. 접속 2~3만

만족도는?: 축구경기 예상 및 결과 만족도 높음. 그런 자료를 최상단에 배치하는 것이 지금 작업


뉴스추천시스템

요구사항

에디터 선택 : 최소한의 필터링

최신뉴스

2~3만개 뉴스 제공 / 일

양적 + 질적 평가?

A, B test


업무 프로세스 변화


오프라인 평가 - 온라인 평가 - 서비스


데이터 분석자가 요구사항을 받고 서비스 개발팀에 API 제공을 통해, 개발과 분석이 디커플링을 이룸

in memory data grid 로 전환(기존에 nosql + RDB + 카산드라 + 몽고db)

네트워크 지연이 발생, 캐쉬를 두지만 복잡도가 증가.. 고민중 ..예상 spark + mahout

온라인평가에서는 10~15% 에게 변경된 알고리즘 적용해서 오프라인 평가와 다시 비교한다.(월 2회)


결과

news CTR 증가, 커뮤니티 활동 및 뉴스 보는 체류 시간도 체크