Apitore blog

Apitoreを運営していた元起業家のブログ

2016-12-05から1日間の記事一覧

Java(PDFBox)でPDFファイルからテキストを抽出する

はじめに Apitoreの次の商品の仕込みをしています。今回はJavaでPDFファイルからテキスト情報を取得します。ApacheからPDFBoxというOSSが出ていて、version 2.0から日本語にも対応したそうなのでこちらを使います。