2007.04.20 Friday
Plaggerの紹介 6
各プラグインの紹介(Filter編)。
●フィード・エントリから取得
・Filter::EntryFullText
HTMLから全てのフィードを取得
詳しくは、下記のサイトを参照
http://wiki.shibuya.pl/?HowToEntryFullText
・Filter::ExtractAuthorName
authorタグから名前を取得
詳しくは、下記のサイトを参照
http://subtech.g.hatena.ne.jp/miyagawa/20060815
・Filter::FetchEnclosure
enclosureタグ(Podcastで使われる)に記載されたデータファイル(画像など)を取得
・Filter::FetchEnclosure::Curl
Curlを使って、enclosureタグに記載されたファイルを取得
・Filter::FetchEnclosure::ParallelUA
最大同時接続数・同一ホストごとの最大リクエスト数を指定して、enclosureタグに記載されたファイルを取得
・Filter::FetchEnclosure::Wget
wgetコマンドを使って、enclosureタグに記載されたファイルを取得
・Filter::FetchEnclosure::Xango
Xangoを使って、enclosureタグに記載されたファイルを取得
・Filter::FindEnclosures
MP3やaviなどへのリンク(aタグ)、rel="enclosure"を含むリンク(aタグ)、画像と動画(img、embedタグ)を抽出
・Filter::HEADEnclosureMetadata
HEADリクエストを使って、enclosureタグに記載されたファイルを取得
●フィード・エントリに追加
・Filter::2chNewsokuTitle
2chのニュース速報形式に、タイトルの前後にタグを追加
・Filter::2chRSSContent
2chRSSのフィードに、日付と投稿者を追加
・Filter::AtomLinkRelated
「link rel="related"」を追加
・Filter::BulkfeedsTerms
bulkfeeds.netのタグを追加
・Filter::Delicious
del.icio.usでそのURLに付いたタグとブックマーク数を追加
・Filter::HatenaBookmarkTag
はてなブックマークに付いたタグを追加
・Filter::HatenaBookmarkUsersCount
はてなブックマークのブックマーク数を追加
・Filter::HatenaDiaryKeywordLink
はてなキーワードへのリンクを追加
・Filter::HatenaKeywordTag
はてなキーワードのタグを追加
・Filter::ImageInfo
画像の情報(縦横の長さ、ファイルの種類など)を取得
・Filter::LivedoorClipUsersCount
LivedoorClipのクリップ数を追加
・Filter::TagsToTitle
タグをタイトルに追加
・Filter::Thumbnail
img.simpleapi.netのWebページサムネールのリンクを追加
●フィード・エントリを変換
・Filter::Babelfish
Babelfishを使って翻訳
・Filter::BreakEntriesToFeeds
フィードをエントリごとに分割
・Filter::CompositeFeed
単一のフィードにまとめる
・Filter::DegradeYouTube
YouTubeの動画を、画像+動画へのリンクに変換
・Filter::DeliciousFeedTags
del.icio.usRSSのタグを変換
・Filter::Emoticon
Text::Emoticonを使用して顔文字を変換
・Filter::FloatingDateTime
タイムゾーンが無い日時を、システムで設定したtimezoneに変換
・Filter::ForceTimeZone
全ての日時を、システムで設定したtimezoneに変換
・Filter::GuessLanguage
フィード・エントリの言語を推測し、language情報を変換
・Filter::GuessTimeZoneByDomain
timezoneをドメインから推測し、timezone情報を変換
・Filter::HTMLScrubber
HTMLタグのサニタイズ
・Filter::HTMLTidy
HTML TIDYによるHTMLの整形
・Filter::HatenaFormat
はてな記法を、通常のHTMLに変換
・Filter::Kansai
関西弁に変換
・Filter::Markdown
Wikiのようなマークダウン記法のテキストを、HTMLに変換
・Filter::RSSLiberalDateTime
RSS 2.0の日付を変換
・Filter::RSSTimeZoneString
RSS 2.0のタイムゾーンを変換
・Filter::ResolveRelativeLink
相対パスを絶対パスに変換
・Filter::RewriteEnclosureURL
ファイルパスをURL形式に変換
・Filter::Romanize
・Filter::Romanize::Japanese
Kakasiで日本語をローマ字に変換する
・Filter::TTP
ttp://〜となっている文字列を、http://〜に変換
・Filter::UnicodeNormalize
Unicodeの正規化
●フィード・エントリから除去
・Filter::BlogPet
BlogPetの投稿した記事を除去
・Filter::BloglinesContentNormalize
Bloglinesの広告を除去
・Filter::FeedBurnerPermalink
FeedBurnerのリダイレクタを除去
・Filter::FeedFlareStripper
FeedBurnerのFeedFlareを除去
・Filter::HatenaDiaryKeywordUnlink
はてなキーワードへのリンクを除去
・Filter::LivedoorKeywordUnlink
Livedoorキーワードへのリンクを除去
・Filter::POPFile
POPFileによるスパム除去
・Filter::Profanity
不適切な表現の除去
・Filter::Rule
条件を指定し、一致するものを除去
詳しくは、下記のサイトを参照
http://d.hatena.ne.jp/hazy-moon/20061025/rule
http://plagger.org/trac/wiki/CookbookDedupeEntries
・Filter::SpamAssassin
スパムを除去
・Filter::StripRSSAd
RSS広告を除去
・Filter::StripTagsFromTitle
タイトルからタグを除去
・Filter::TruePermalink
URLからリダイレクタ等を除去
・Filter::URLBL
URLブラックリストを使ってspam blogを除去
・Filter::tDiaryComment
tDiaryのコメントを除去
●その他
・Filter::Base
不明
・Filter::Pipe
任意のコマンドをフィルタに適用
・Filter::Regexp
正規表現で置換