※ 테스트 요약
▶수집된 영화 데이터로 추천 모델을 만들고 사용자에게 재미있을 영화를 추천한다. @@ 혼자 예제 보고 따라한 것임 @@ |
※ 영화 추천을 위한 데이터 확인
□ 영화 정보 - 영화아이디 | 제목 | 장르
movieId,title,genres ... |
□ 영화 평점 - 아이디번호 | 영화번호 | 점수 | 타임스탬프
userId,movieId,rating,timestamp ... ...
|
※ 데이터 읽기
SparkSession spark = SparkSession.builder().master("local[4]").appName("ALSExample") //영화 평점 데이터 로딩 Dataset<Row> rating = //영화 정보 데이터 로딩 Dataset<Row> movie = //영화 아이디로 데이터 조인 Dataset<Row> joins = rating.join(movie, "movieId"); //조인 결과(Eclipse Console)
|
※ 영화 추천
//8:2 로 학습 데이터와 테스트 데이터로 나눔 Dataset<Row>[] splits = joins.randomSplit(new double[]{0.8, 0.2}); //ALS 모델 생성 .setRegParam(0.01) .setItemCol("movieId") .setUserCol("userId") .setRatingCol("rating"); //평점 데이터 삭제 후 예측 Dataset<Row> predictions = model.transform(test.drop("rating"));
아이디 516번 유저는 12번 드라큘라 영화의 경우 5점 만점에 3.166의 만족 전체 데이터 중에 아이디 516번 유저 데이터를 sort하여 높은 점수 추천 |
'데이터 분석' 카테고리의 다른 글
Spark - Naive Bayes (단어를 이용한 문서 구별) (0) | 2017.05.12 |
---|---|
mahout - 설치 및 User 기준 추천 (0) | 2017.05.11 |
Spark - Gaussian Mixture Model Example (0) | 2017.05.01 |
Spark - K-means (0) | 2017.05.01 |
머신러닝 유형 (0) | 2017.04.28 |