□ 참고내용
▶선행(antecedent)과 후행(consequent)은 공통원소가 없는 항목들의 집합 ▶앞에 작성한 FP-growth에 Support, Confidence 내용 참고
|
□ Sample
※spark documents 참고
▶a -> 15회 구매 ▶b -> 20회 구매 ▶a, b -> 15회 구매
|
□ 예제
JavaRDD<FPGrowth.FreqItemset<String>> freqItemsets = jsc.parallelize(Arrays.asList( new FreqItemset<String>(new String[] { "a" }, 15L), new FreqItemset<String>(new String[] { "b" }, 20L), new FreqItemset<String>(new String[] { "a", "b" }, 15L)));
JavaRDD<AssociationRules.Rule<String>> results = arules.run(freqItemsets); System.out.println(rule.javaAntecedent() + " => " + rule.javaConsequent() + ", " + rule.confidence()); }
|
□ 결과
▶물건으로 생각하면 a를 살(15회) 경우 b를 함께 살 경우는 (15회) 임에 1.0이 되고 ▶b를 살(20회) 경우 a를 함께 살 경우는 (15회) 임에 0.75의 결과를 얻는다.
|
'데이터 분석' 카테고리의 다른 글
Spark - Ranking systems (2) - 예제 테스트 (0) | 2017.07.24 |
---|---|
Spark - Ranking systems (1) - 이론 (2) | 2017.07.24 |
Spark - Multiclass classification (0) | 2017.07.20 |
Spark - Isotonic Regression (0) | 2017.07.03 |
Spark - FP growth (FP tree) (0) | 2017.06.23 |