웹사이트에 있는 내용을 워드 클라우드로 만들어보기
페이지 정보
본문
워드클라우드 얼마 전 만나 뵌 한 교수님이 개발 중인 심리치료 연구에서, 내담자들의 저널링 과제로 질적 데이터는 잔뜩 수집했는데 바쁘셔서 분석을 못하는 중이라고 했던 게 퍼뜩 생각이 났다. 연구에서 데이터 수집 과정이 얼마나 지난하고 어려운지 알기에, 데이터가 쌓여있다는 말에 마음이 혹한 건 사실이다. 도둑놈 심보라 해도 어쩔 워드클라우드 수 없다... 하지만 인간 대상 연구에서 데이터 모으기는 정말이지 너무나도 까다롭다. 대학원 다닐 때도 그것 땜에 밤낮, 주말 없이 얼마나 피.땀.눈물을 흘렸는지 모른다. 아무튼 그 모으기 까탈스러운 데이터가 쌓여 있다는 말을 듣고, 누가 준다고 한 적도 없는데 혼자 설레는 마음으로 집에 와서 찾아보게 된 게 워드클라우드 바로 이 워드 클라우드였다. 워드 클라우드(Word Cloud)는 간단히 말해서, 텍스트에 사용된 단어들의 빈도수를 분석하여 시각화 자료로 보여주는 것이다. 왼쪽 위키피디아에서 검색한 'Gratitude Journal'텍스트를 오른쪽 워드 클라우드를 통해 최다 빈 출어 위주로 시각화할 수 있다 예전 자살 연구하는 기관에서 일할 적에 이 워드 클라우드를 사용했던 게 워드클라우드 생각이 났다. 그때는 유서 데이터를 이런 식으로 분석해서, 가장 많이 나온 단어가 무엇인지 찾아봤던 기억이 있다. 그 역시도 쉽게 얻을 수 없는 데이터였고, 결과도 의외였어서 참 놀랐었다. '사랑해, 미안해, 고마워'가 압도적으로 많이 나와서 다들 멍하니 바라보며 가슴 먹먹해하던 기억이 난다. 아마 심리치료 연구에서도 표현적 글쓰기나 워드클라우드 감사일기, 자동적 사고기록지 같은 자료를 수집한다면 분석해 봐도 상당히 의미 있는 자료들이 나올 것으로 생각한다. 이 워드 클라우드는 R과 R 스튜디오를 통해 생각보다 쉽게 생성할 수 있다. 특히 아래 블로그 포스팅에 설명이 너무 잘 되어있어서 가져와 보았다(하단 링크 참조). R 초보임에도 천천히 따라 할 워드클라우드 수 있게 코드랑 설명이 다 들어있어서 공유해둔다. 블로그 설명을 따라서 웹페이지에 있는 텍스트를 가지고 실험적으로 워드 클라우드를 만들었는데, 엑셀이나 메모장에 있는 텍스트를 불러와서 할 수 있는지 등등 응용해서도 계속 살펴봐야겠다. 안녕하세요! May입니다 :-D 오늘은 영어 텍스트로 워드클라우드를 만드는 방법을 다뤄보겠습니다 :) 워드... 요즘 들어 참 워드클라우드 신기하다고 느낀 게, 이전 경험했던 것들이 자양분이 되어 착실하게 모여있다는 것이다. 그 당시에는 울며 불며 욕하며 힘들었던 기억만 남는 줄 알았는데, 시간이 지나고 보니 내 것으로 다 남아있다는 게 신기할 따름이다. 머리 어딘가 깊은 저 편에서 떠오르는 걸 보니까 말이다. 지금은 큰 스트레스 없이 혼자 워드클라우드 하고 싶은 공부를 하며 놀고먹고 있지만, 다시금 힘들게 무언가 해야 될 시간이 온다면 기꺼이 맞이하고 싶다. 일단, 앞으로 블로그 공부 카테고리도 차곡차곡 쌓아가 볼 생각이다. 하다 보면 뭐라도 되겠지!
- 이전글김해 주촌 홀덤[링게임,10-50만 바인] 24.08.12
- 다음글해운대취미미술학원/해운대미술학원/부산해운대고구려미술학... 24.08.12
댓글목록
등록된 댓글이 없습니다.