はじめに

今回は最大被覆モデルを使ったツイートの要約APIを作りました。キーワードを指定すると直近の話題を要約して教えてくれる、まるで執事のようなAPIです。たとえば「気になっている製品の市場の声を知りたい」「自分の会社のニュースや評判を知りたい」「今流行しているFGO関連のネタツイートを知りたい」などの用途で使えます。

続きを読む

はじめに

今回はTwitterの検索APIです。今回のAPIは、既にTwitterから情報収集したことがある人にとっては不要のAPIになりますが、「ちょっとTwitterのAPIを使ってみたい」という人には役立つAPIだと思います。特徴は『クリックだけでTwitterと連携してツイートの収集が始められる』ところです。以降では、技術面も含めて解説します。

続きを読む

はじめに

先日のTFIDFを使った文章タグ計算のAPIに続いて、今度はword2vecを使って文章の要約単語を抜き出しました。TFIDFだと意味的に類似した単語の区別がつかないのですが、word2vecであれば意味的に類似した単語がコサイン距離で分かるので、出力の文章タグがそれぞれ独立した単語になります。
amarec (20161225-071022)

続きを読む

はじめに

文章のタグ付けAPIを公開しました。TFIDFで文章の代表語を計算します。文章に適切なタグを付ければ、あとから文章を探すときや特定の分野の文章をまとめて検索するときに役立ちます。TFIDFはオーソドックスな手法ですが、大きく外れることもない安定した手法です。
amarec (20161225-071016)

続きを読む

はじめに

長い文章を単文に分割するAPIを公開しました。例えば、文書要約では要約文を生成するアプローチと、要約文を抽出するアプローチとありますが、本APIは後者をするときに役立ちます。簡単なヒューリスティックスを使っているので、あまり精度はよくありません。暫定的な処置としてお使い下さい。
amarec (20161225-071002)

続きを読む

はじめに

昨日の続きです。Jsoupというライブラリを使ってウェブスクレイピングするAPIを作りましたので公開します。今回は前回より少し踏み込んだAPIです。URLを入力するとそのURL内に含まれるHrefリンク全てを取得するAPIと、URLを入力するとそのURL内に含まれるimgタグのsrcリンク全てを取得するAPIを紹介します。
amarec (20161214-224217)

続きを読む