input & output

暇な公認会計士が、監査や身近な会計、その他自由に意見を述べています。

今年の新規上場会社の「Ⅰの部」のPDFファイルをまとめて入手する。

導入


Qiitaに浮気しようかと思ったけど、はてなブログProの料金支払ってたことを思い出して、浮気をやめた。

さて、唐突だけど、新規上場会社が提出する「Ⅰの部」の開示例を調べたくなった。有料の便利なツールは使えないから、日本証券取引所のHPでまとめて掲示されているpdfファイルをごっそり頂くことにした。

 

本日のメニュー



最近の「Ⅰの部」を開示例をまとめて入手するbeautifulなsoup。

 

調理台の環境


 

Python version: 3.6.1 |Anaconda 4.4.0 (x86_64)

Beautiful Soup version: 4.6.0

 

食材



日本証券取引所の新規上場会社情報ページ

www.jpx.co.jp

 

調理器具



beautifulsoup4

 

調理の失敗として想定されること



対象ページのHTML構造の変更

 

今日の鍋


jpx_new

 

完成品



「Ⅰの部」のpdfファイルが数十個。

 

参考文献、参照URL


退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

 

 本屋に行くと、プログラミング関連のブースで平積みされていることもある。

今回は、正規表現の書き方と、beautifulsoupの使い方を参考にした。

 
beautifulsoupのページ

 

おまけの電車コーナー


 

https://www.instagram.com/p/BYIHznpH8QJ/

この間 #イーストアイ に追い抜かされた。

https://www.instagram.com/p/BYIHo9hHDyq/

#EF81 が小田急ひっぱってた!@大宮駅