Apitore blog

Apitoreを運営していた元起業家のブログ

【API】ニュースサイト ごちゃまぜフィード

はじめに

新聞やニュース系サイトが提供しているRSSをまとめて、新着順にソートしたフィードAPIを作りましたのでApitoreで公開します。テレビをまったく見ないので最近の時事問題とかが分からなかったりします。コミュ力向上=話題力、だと思うので勉強がてらAPI作りました。

API

サンプルコード

関連記事

RSS対応サイト

  • Huffington Post Japan
  • IBTimes エンタメ・スポーツ
  • IBTimes グローバル
  • IBTimes マーケット
  • IBTimes ライフ
  • IBTimes 企業
  • IBTimes 経済
  • IBTimes IT・サイエンス
  • ダイヤモンド・オンライン
  • ビジネスジャーナル
  • 東洋経済オンライン
  • 毎日新聞
  • CNN

事前準備

APIコールまでの準備(API登録、アクセストークン発行、サンプル実行)はこちらを参考にしてください。

使ってみる

API登録、アクセストークン発行が終わったら、こちらのswagger UIから簡単に動作を試すことができます。APIレスポンスのフォーマットも載ってますが、ここにも記載しておきます。

FeedResponseEntity {
  endTime (string): End date ,
  entries (Array[FeedEntryEntity]): Entries ,
  lastUpdatedAt (string): Last Updated At ,
  log (string): Log message ,
  num (integer): Num ,
  page (integer): Input page num ,
  processTime (string): Process time [millisecond] ,
  startTime (string): Start date
}
FeedEntryEntity {
  author (string, optional): Author ,
  description (string, optional): Description ,
  link (string): Link ,
  pubDate (string): Published Date ,
  sourceLink (string): Source Link ,
  sourceTitle (string): Source Title ,
  title (string): Title
}

さっそく使ってみます。下の例では「毎日新聞」が多いですが、実際は時間帯でかなりばらつきがあります。「CNN」はたまに広告が入ってますが、タイトルの先頭に「PR:」ってついてるのでその気になれば除外できます。descriptionにHTMLのタグが入っているのはメリット/デメリットありますね。

"page": 1,
"lastUpdatedAt": 1489900056977,
"num": 270,
"entries": [
  {
    "sourceTitle": "国際ニュース - CNN.co.jp",
    "sourceLink": "http://www.cnn.co.jp",
    "author": "",
    "title": "「ロックの父」、チャック・ベリーさん死去 90歳",
    "link": "http://www.cnn.co.jp/showbiz/35098344.html?ref=rss",
    "description": "
音楽界のパイオニアで「ロックンロールの父」として知られるチャック・ベリーさんが18日、米ミズーリ州セントルイス郊外の自宅で死去した。90歳だった。同州セントチャールズ郡の警察が明らかにした。\n\n同警察のフェイスブックへの投稿によれば、通報を受けた当局者が住宅へ向かうと、中で男性を発見したが反応がなかった。救命措置が取られたものの、その後、ベリーさんの死亡が確認された。\n\nベリーさんは、「ジョニー・...
",
    "pubDate": 1489898580000
  },
  {
    "sourceTitle": "毎日新聞 - ニュース速報(総合)",
    "sourceLink": "http://mainichi.jp",
    "author": "",
    "title": "選抜高校野球:開幕戦は延長 逆転勝ちで呉が甲子園初勝利",
    "link": "http://rss.rssad.jp/rss/artclk/ZLcY1bpa2mkX/be7352da679a347b0fecfb6924f052fb?ul=Ab9ZHB_z0ckFJElMgRZ.nwK0pCHKDcLM3OAD0WUjur5gYDNaKFCrPB8OZQ4vgcpJs2ReaFcQLr6TDmBycDJCXhuCKQnZKuNQbzMHup8BE0.dNHEZC",
    "description": "<img border=\"0\" width=\"1\" height=\"1\" src=\"http://rss.rssad.jp/rss/artimg/ZLcY1bpa2mkX/be7352da679a347b0fecfb6924f052fb\"/>",
    "pubDate": 1489898310000
  },
  // 中略
  {
    "sourceTitle": "毎日新聞 - ニュース速報(総合)",
    "sourceLink": "http://mainichi.jp",
    "author": "",
    "title": "コーヒートリビア:米で人気の日本人ブロガー本が逆上陸",
    "link": "http://rss.rssad.jp/rss/artclk/ZLcY1bpa2mkX/47281d46d59830b869012686ae191857?ul=G3kKCrLI.nTvhmQee66q1HoLVOR4wO1.yyqqfoY.hMFyxSw2mSuH6ZVuToHSkViJSsO2UhV4WETKTABFEPbIjwNBFmtu",
    "description": "

",
    "pubDate": 1489891915000
  }
]

おわりに

ニュースのRSSはおもしろいですね。RSSだけで学習し続けたらすごい面白いAIできそうです。「政治家/経営者のお供に世界中のニュースに超詳しいAI」とかワンチャンでビッグビジネスにならないですかね?笑