2019/04/24
スライドと言えばおなじみのサービスSpeakerDeckから日本語のスライドをまとめたサイトを作りました!
SpeakerDeckが提供しているAtomフィードから抽出
https://speakerdeck.com/c/technology.atom
https://speakerdeck.com/c/programming.atom
etc..
フィードのtitle
, content
から日本語(厳密に言えば中国語もひっかかる)かどうかのチェックを正規表現より抽出する。
/[\p{Han}\p{Hiragana}\p{Katakana}]/
カテゴライズも同じくフィードのtitle
, content
から正規表現でカテゴライズ
# イメージ(ruby)
if "dockerの秘密".match(/docker/i).present?
category = "docker"
end
上記のバッチを1時間に1回動かしています。