본문 바로가기

데이터 분석

MLlib(K-Means) + SparkStreaming 실시간 Clustering (1)

336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

□ 내용


진행 과정은 아래와 같으며 수집된 데이터를 이용하여 모델을 만들고 새롭게 들어오는 데이터들을 예측 분류한다.


1. 모델 생성을 위한 데이터 수집


2. 필요한 데이터만 추출하여 모델 생성


3. 스트리밍(SparkStreaming) 데이터의 K-Means 분류(Clustering)

 




□모델 생성을 위한 데이터 수집


예전에 수집해서 Mongo에 저장해 두었던 센서 데이터 사용


쓸만한 것은 센서 RSSI 값만 있는 것 같다. 그래서 특성은 1개만으로 처리할 것임


 





□ 모델 생성







□ 결과


모델 생성 후 테스트로 -50과 -90의 분류 결과를 테스트해 보았다. 각각 0번 분류 / 1번 분류로 나왔다.



모델이 올바르게 생성되었으며 나머지 정보는 아래와 같다.






모델 확인



지정한 위치에 저장되어 있다. 이제 모델을 Sparkstreaming에 적용해 보자.