본문 바로가기

데이터 분석

Spark - AssociationRules

336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.


참고내용


▶선행(antecedent)과 후행(consequent)은 공통원소가 없는 항목들의 집합


앞에 작성한 FP-growth에 Support, Confidence 내용 참고

 






□ Sample

spark documents 참고


a -> 15회 구매

b -> 20회 구매

a, b -> 15회 구매

 






예제


        JavaRDD<FPGrowth.FreqItemset<String>> freqItemsets = jsc.parallelize(Arrays.asList(

                new FreqItemset<String>(new String[] { "a" }, 15L),

                new FreqItemset<String>(new String[] { "b" }, 20L),

                new FreqItemset<String>(new String[] { "a", "b" }, 15L)));


        AssociationRules arules = new AssociationRules().setMinConfidence(0); //결과를 다 찍어보자

        JavaRDD<AssociationRules.Rule<String>> results = arules.run(freqItemsets);

       
        for (AssociationRules.Rule<String> rule : results.collect()) {

            System.out.println(rule.javaAntecedent() + " => " + rule.javaConsequent() + ", " + rule.confidence());

        }

 






□ 결과



물건으로 생각하면 a를 살(15회) 경우 b를 함께 살 경우는 (15회) 임에 1.0이 되고


b를 살(20회) 경우 a를 함께 살 경우는 (15회) 임에 0.75의 결과를 얻는다.

 




'데이터 분석' 카테고리의 다른 글

Spark - Ranking systems (2) - 예제 테스트  (0) 2017.07.24
Spark - Ranking systems (1) - 이론  (2) 2017.07.24
Spark - Multiclass classification  (0) 2017.07.20
Spark - Isotonic Regression  (0) 2017.07.03
Spark - FP growth (FP tree)  (0) 2017.06.23