워드클라우드 예제

짧은 소개에 대한 예제 / simple.py를 확인하십시오. 샘플 출력은 다음과 같습니다 WordCloud는 주어진 텍스트 중에서 가장 빈번한 단어를 표시하는 기술입니다. 함수를 사용하기 전에 가장 먼저 해야 할 일은 함수의 문서 문자열을 체크 아웃하고 필요한 모든 인수와 선택적 인수를 확인하는 것입니다. 이렇게 하려면 ?function을 입력하고 실행하여 모든 정보를 가져옵니다. 당신은 그것을 했다! 텍스트 분석을 시각화하는 데 도움이 되는 WordCloud를 그리는 몇 가지 방법을 배웠습니다. 또한 원하는 색상을 사용하여 구름을 어떤 모양으로도 마스크하는 방법도 배웁니다. 기술을 연습하려면 DataCamp의 프로젝트인 기계 학습 복사에서 가장 인기 있는 주제를 고려하고 스프레드시트에서 붙여넣거나 직접 입력하십시오. 탭, 쉼표, 콜론 또는 공백이 있는 열을 분리합니다(예제 참조). 그런 다음 위와 같이 워드 클라우드를 만듭니다.

생성 및 생성의 두 단계를 아래와 같이 하나로 결합할 수 있습니다. 색상 매핑은 워드 클라우드 라이브러리의 ImageColorGenerator 기능을 사용하여 클라우드를 플롯하기 직전에 수행됩니다. 호주, 미국, 포르투갈, 이탈리아, 프랑스는 모두 100포인트 와인이 있습니다. 당신이 통지하는 경우, 포르투갈은 5 위, 호주는 데이터 세트에서 생산 와인의 수에서 9 위, 두 나라는 와인의 8000 개 미만의 종류가. 현재 사용 중인 데이터 집합을 알아차리려면 약간의 데이터 탐색이 필요합니다. 이제 식사의 메인 코스인 WordCloud에 뛰어들기 시작합니다. 모든 마스크 이미지가 동일한 형식을 가지는 것은 아니며, 따라서 WordCloud 기능이 제대로 작동하지 않습니다. 마스크가 작동하는지 확인하기 위해, numpy 배열 형태로 살펴 보자 : 이미지를 저장하려면 WordCloud는 다음 예제에서 „마틴 루터 킹”에서 „꿈의 연설을 가지고 있다”를 처리하지만 텍스트를 사용할 수 있습니다. 원하는 : 좋아! 올바른 마스크를 사용하면 선택한 모양으로 워드 클라우드를 만들 수 있습니다. WordCloud 함수에서 위에서 만든 변환된 마스크를 받는 마스크 인수가 있습니다. 등고선_너비와 윤곽선_색상은 이름으로 구름의 윤곽선 특성을 조정하는 인수입니다. 여기에 있는 와인 병은 레드 와인 병이므로 firebrick은 윤곽 색상에 좋은 선택인 것 같습니다.

색상의 더 많은 선택을 위해, 당신은 이 색상 코드 테이블 ABCya의 단어 구름 생성기도구보다 더 장난감을 살펴 볼 수 있습니다. 그것은 WordCloud.com 단순화 된 버전처럼 느껴지며 사용하기 쉬운 어린이 친화적 인 인터페이스에 대한 가장 기본적인 사용자 정의 옵션을 제외한 모든 옵션을 희생합니다. 소수의 미리 설정된 색 구성표, 모양 및 글꼴을 사용하여 기본 단어 클라우드를 순간에 채찍질할 수 있습니다. WordCloud.com 빈 캔버스인 경우 ABCya는 색칠공부입니다. 내가 발견 한 유일한 딸꾹질은 내 단어 구름의 이미지를 저장할 때 발생했습니다. 이미지의 하단이 잘려졌지만 옵션을 만지작거리면서 문제가 해결되었습니다. 이것은 아마도 초등학교 교실에서 단어 구름을 만들 계획이라면 선택할 수있는 발전기일 것입니다. 여러 번 당신은 주파수 또는 각 단어의 중요성을 나타내는 다른 크기의 단어의 많은 가득 구름을 볼 수 있습니다. 이를 태그 클라우드 또는 워드클라우드라고 합니다. 이 자습서에서는 파이썬에서 자신의 WordCloud를 만들고 적합하다고 판단되는 대로 사용자 지정하는 방법을 배웁니다. 이 도구는 텍스트 데이터를 탐색하고 보고서를 보다 활발하게 만드는 데 매우 유용합니다. 이제 max_font_size, max_word 및 background_color와 같은 WordCloud의 선택적 인수를 변경합니다.

또는 더 많은 옵션을 보려면 예제/masked.py를 실행합니다.