サイトマップの自動生成
RSS2.0RSS2.0RDFフォーマット
No.194 | 最新 | Back | Next |

■ トラックバック ■

サイトマップの自動生成
2006/1/21(土)
現在サイトマップを自動生成するスクリプトを開発中。

もともとは、自分のサイトの為に作成したものだが、SEO対策、アクセスアップ対策、検索ロボット対策などに必要だから作ってくれないかと依頼あり。
そのため、ブラッシュアップ中。

調査したいサイトのトツプページURLを指定して、そのページに張られているリンクからリンクを渡り歩きながら、そのサイトすべてのページを巡回し、そのページのタイトル、URL、リンク元のテキストリンク、画像リンクのalt属性を収集。 

リンクには、ホスト付き絶対アドレス、ホストなし絶対アドレス、相対アドレスがあり、これらを自動判断し、ホスト名付きのURLに自動変換。

指定したアドレスより上層部は巡回しない。
ホスト名違いは巡回しないなどの対策をする。
無限ループ、(循環参照)などの回避策をとる。
バックトラッキング法を用い、巡回スピードの高速化と二重参照を防ぐ。

出来上がり次第、XML化を図る。
 
1 | 06/01/21 (土) 22:19 | テクニカル
この記事へのトラックバック
http://beginners.atompro.net/atrbexe_jtechn_blog_p1.html
| 最新 | Back | Next |
RSS2.0RSS2.0RDFフォーマット

Home ↑ページトップ

Copyright (c) 2000-2004, all Rights Reserved & Produced by atom
技術提供:株式会社ピーオーピー
SEO対策 & ツール