336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.
□ 내용
▶ 진행 과정은 아래와 같으며 수집된 데이터를 이용하여 모델을 만들고 새롭게 들어오는 데이터들을 예측 분류한다. 1. 모델 생성을 위한 데이터 수집 2. 필요한 데이터만 추출하여 모델 생성 3. 스트리밍(SparkStreaming) 데이터의 K-Means 분류(Clustering)
|
□모델 생성을 위한 데이터 수집
▶ 예전에 수집해서 Mongo에 저장해 두었던 센서 데이터 사용 ▶ 쓸만한 것은 센서 RSSI 값만 있는 것 같다. 그래서 특성은 1개만으로 처리할 것임
|
□ 모델 생성
|
□ 결과
▶ 모델 생성 후 테스트로 -50과 -90의 분류 결과를 테스트해 보았다. 각각 0번 분류 / 1번 분류로 나왔다. ▶ 모델이 올바르게 생성되었으며 나머지 정보는 아래와 같다. ▶ 모델 확인 ▶ 지정한 위치에 저장되어 있다. 이제 모델을 Sparkstreaming에 적용해 보자. |
'데이터 분석' 카테고리의 다른 글
MLlib(K-Means) + SparkStreaming 실시간 Clustering (2) (0) | 2018.02.14 |
---|---|
Spark - Ranking systems (2) - 예제 테스트 (0) | 2017.07.24 |
Spark - Ranking systems (1) - 이론 (2) | 2017.07.24 |
Spark - AssociationRules (0) | 2017.07.21 |
Spark - Multiclass classification (0) | 2017.07.20 |