불용어


불용어(Stopword)

  • 자주 등장하지만 분석에 큰 필요가 없는 단어
  • NLTK에서는 약 100여개 단어를 미리 불용어로 지정해놓음(영어)
  • 개발자가 직접 정의 가능