2016-11-12

archive

bloggerは特に使いづらいこともないのだけど、
webフォームで入力しているとたまにhtmlが汚れるのと、
画像やcss等も含めたバックアップが気になったので
Firebaseのホスティングを使ってアーカイブを作った。
An At a NOA

過去記事をすべてテキストデータに変換し、
テンプレートに流し込んで各ページのhtmlを作成した。
cssはすべて手打ちである。
Hugoあたりの静的サイトジェネレータを使うことも
検討中だが、取り急ぎはFirebaseのコマンドライン
ツールとgolangで書いたスクリプトだけで事足りる。

可能な限りjavascriptやcgiを使いたくないのだが、
サイト内検索だけはできるようにしたい。
やはりGoogleのカスタム検索エンジンが第一候補か。

あと、ラベル情報を反映していないのだが、
ラベリングの仕組みを自動化したい。
今や深層学習で写真に写っている要素を言語化することも
可能なので、文章の内容からラベルを生成するくらい
できそうだが、あまりよいものが見つからない。

特定のラベルをつけるのではなく、Googleクラウド自然言語API
で全記事を形態素解析して、記事ごとにDoc2vecで距離が近い順に
他の記事を下に表示するとかでもよいかもしれない。

No comments:

Post a Comment