top
(
JavascriptをONにしていただいた方がより快適に利用できます。
)
|
詳細表示
|
ツリー表示
|
No.194
|
最新
|
Back
|
Next
|
■ テクニカル ■
名前
タイトル
コメント
検索文字
【カテゴリー】
すべてのカテゴリー
更新履歴
テクニカル
覚え書き
つぶやき
技術情報
リンク
【最近の記事】
05/07-SEO対策&ツールの ‥
04/26-新サーバー構築
04/25-新自宅サーバー構 ‥
04/24-販売管理ユーザー ‥
03/28-迷惑メール(スパ ‥
03/27-サーバーの電源関 ‥
03/25-ようやくサーバー ‥
03/12-アフィリエイトサ ‥
03/11-アフィリエイトサ ‥
02/28-引き続きブログの ‥
02/27-ブログのping
02/26-引き続きブログ形 ‥
02/25-ブログ形式の掲示 ‥
02/19-DNSサーバー構築
02/18-サーバー復旧..
02/17-サーバーパソコン ‥
02/16-ポート振り分けの ‥
02/16-迷惑メール、不正 ‥
02/15-不正アクセス、迷 ‥
02/14-不正アクセス、迷 ‥
【最近のコメント】
Yu/ありがとうござい ‥
atom/失礼いたしました ‥
Yu/記事には関係ない ‥
atom/あははは
はる/あらら
atom/あははは
はる/mimi-mimi→ はる
atom/webminのバックアッ ‥
【最近のトラックバック】
SEO対策 & ツール/超初心者のHP作成 ‥
SEO対策 & ツール/調査ツールの不具 ‥
SEO対策 & ツール/セキュリティ強化
SEO対策 & ツール/検索エンジンのCGI ‥
SEO対策 & ツール/Googleの順位
SEO対策 & ツール/タオル関係のユー ‥
SEO対策 & ツール/検索エンジンのSEO ‥
SEO対策 & ツール/SEO対策とモジュー ‥
SEO対策 & ツール/Googleでの順位
SEO対策 & ツール/WEBツールモジュー ‥
SEO対策 & ツール/Google検索エンジン ‥
SEO対策 & ツール/aspモジュール、イ ‥
SEO対策 & ツール/WEBツールの不具合 ‥
【過去ログ】
2006 年 05 月
2006 年 04 月
2006 年 03 月
2006 年 02 月
2006 年 01 月
【リンク】
SEO対策&ツール
迷惑メールのgravey ‥
■ トラックバック ■
サイトマップの自動生成
2006/1/21(土)
現在サイトマップを自動生成するスクリプトを開発中。
もともとは、自分のサイトの為に作成したものだが、SEO対策、アクセスアップ対策、検索ロボット対策などに必要だから作ってくれないかと依頼あり。
そのため、ブラッシュアップ中。
調査したいサイトのトツプページURLを指定して、そのページに張られているリンクからリンクを渡り歩きながら、そのサイトすべてのページを巡回し、そのページのタイトル、URL、リンク元のテキストリンク、画像リンクのalt属性を収集。
リンクには、ホスト付き絶対アドレス、ホストなし絶対アドレス、相対アドレスがあり、これらを自動判断し、ホスト名付きのURLに自動変換。
指定したアドレスより上層部は巡回しない。
ホスト名違いは巡回しないなどの対策をする。
無限ループ、(循環参照)などの回避策をとる。
バックトラッキング法を用い、巡回スピードの高速化と二重参照を防ぐ。
出来上がり次第、XML化を図る。
1 | 06/01/21 (土) 22:19 | テクニカル
トラックバック(0)
コメント入力(0)
訂正
この記事へのトラックバック
http://beginners.atompro.net/atrbexe_jtechn_blog_p1.html
|
詳細表示
|
ツリー表示
|
|
最新
|
Back
|
Next
|
Home
↑ページトップ
Copyright (c) 2000-2004, all Rights Reserved & Produced by
atom
技術提供:
株式会社ピーオーピー
SEO対策 & ツール
もともとは、自分のサイトの為に作成したものだが、SEO対策、アクセスアップ対策、検索ロボット対策などに必要だから作ってくれないかと依頼あり。
そのため、ブラッシュアップ中。
調査したいサイトのトツプページURLを指定して、そのページに張られているリンクからリンクを渡り歩きながら、そのサイトすべてのページを巡回し、そのページのタイトル、URL、リンク元のテキストリンク、画像リンクのalt属性を収集。
リンクには、ホスト付き絶対アドレス、ホストなし絶対アドレス、相対アドレスがあり、これらを自動判断し、ホスト名付きのURLに自動変換。
指定したアドレスより上層部は巡回しない。
ホスト名違いは巡回しないなどの対策をする。
無限ループ、(循環参照)などの回避策をとる。
バックトラッキング法を用い、巡回スピードの高速化と二重参照を防ぐ。
出来上がり次第、XML化を図る。