2007年10月18日
Google AdSenseセクションターゲットのタグ
Google AdSense に セクション ターゲットなるタグがあるそうで、AdSenseの表示広告の精度を上げる効果があるらしい。。ほう。。
Google AdSense ヘルプ センター: セクション ターゲット
<!-- google_ad_section_start -->
<!-- google_ad_section_end -->
で挟んだ部分がメインの部分なんで関連した広告出してねぇ~って自己申告するものらしいです(W
ホンマに効くかは不明。
とりあえず、サイドバーなんかは関連不用なんで外したりする。。といったところですな。
でもね、Google AdSense ってドメインごとで大まかな関連広告作ったりしよるやろ??
雑記サイトはその辺が難しいですよね。
「確かにそのテーマが一番話題として多いけど。。」みたいな。。
投稿者 こてつ : 17:24 | コメント (0) | トラックバック
2006年10月06日
Google に Ping。サービス開始
いろんなサーバへpingしておくとBlog巡回が増える?!のですが、Googleのブログ検索サービス「Google Blog Search」でもpingを受けるようになったそうです。
Ping URLです
http://blogsearch.google.com/ping
YAHOO!のブログ検索もかなり前から受け付けていますが、Googleは、やっとping受付です。
さらに巡回やキャッシュが良くなるでしょうか??でもブログ検索自体が まだTOP扱いではないですもんねぇ。。
投稿者 こてつ : 17:22 | コメント (0) | トラックバック
2005年10月24日
極端なYAHOO!さん
Yahoo! SEARCH が稼動してしばらく。。つい先々週末から先週頭あたり、登録カテゴリのフォルダ表示がされないという騒動が起こっていました。
カテゴリのデータベースとの関連がほとんど取れておらず、なんともへんちくりんな検索結果を返し「使えねぇ!」状態でした。
こちらでも書かれてありますが、「検索順位異常」な状態でした。
問い合わせ・抗議をした方の情報からすると、この状態はアルゴの変更中やなにか手を加えて検索順位が変わってきているのではなく、YAHOO!の「ミス」によるもので懸命に「復旧作業」を行っているらしい。
つまりだよ、こんな変な検索結果を「ミス」だと認めた以上「損害」が証明できれば「損害賠償」もできるんぢゃね??(W。。まぁ、それは行き過ぎかもしれないが。。
で、先週末頃カテゴリの情報繁栄のほうもある程度落ち着いてきて。。でてくる検索結果はやっぱり「登録カテゴリ上位占有!!」。。使えねぇ。。まぁ、自分のサイトでも登録されているところもあるわけですが、こう猫も杓子も。。何でもかんでも登録サイトが上位に出てくると。。やっぱり検索結果は金かい!!って思ってしまう。
何故かというと、「並」や「並みの下」ぐらいのサイトでも「金」さえ積めばほぼ確実にカテゴリ登録されているからですよ。。アフィ・サイトもコピー・ツギハギ・サイトも。。
でも、やっぱり普通のユーザーはYAHOO!使ってるんですよねぇ。。
YAHOO!の中の人はGoogle使ってやって来るんですがね(W
投稿者 こてつ : 09:38 | コメント (0) | トラックバック
2005年10月03日
Yahoo! SEARCH 正式版として可動
Yahoo! JAPAN でベータ版としてテストされていたYahoo! SEARCH ですが、正式版として可動。そちらに移行されました。
本日3日の未明。。らしい。
どのように変わったかの詳しいところはそれ相応に詳しいところで確認ください(逃。。爆
今のところのアクセスの履歴を見ていると、カテゴリからやってきている方もいつも同様数ぐらいアクセスしてきているようですが、まだ全体に変更がいきわたっていないとかあるんでしょうか??
それが無いのであれば、カテゴリもそう死んでしまうことは無いのかなぁ。。なんて思います。
しばらく動向を見守らないといけないのと、さらにいっそう上位を狙う手立てを探さないといけません。。
懸念は、結局金で買ったTOP。。というか広告欄?で1ページ目が埋め尽くされることになりかねないことです。。やっぱりそうなるよなぁ。。
一般的に一番多いウィンドウサイズ「1024x768」で全画面ブラウザ表示した場合で見てみる。。検索語句にもよるが、スクロールせずに見えるところにはYahoo!のコンテンツとスポンサーサイトで埋め尽くされる場合も多々あるようです。
投稿者 こてつ : 09:25 | コメント (0) | トラックバック
2005年09月29日
Yahooのインデックス200億ページ?
前のエントリー「rel="nofollow" の検証。。悩ます」を書いていてふと思った。。
少し前。。といっても1ヶ月ぐらい前だったかYahoo!の検索インデックス数が200億ページを超え、Googleの80億ページを大幅に凌いだとの発表があった記事を読んだ記憶がある。。
総ページ数のことについてGoogleでもちょっとした動きがあったようです。
Google のインデックス数が消えた
話を戻します。。Yahoo!のインデックスって、リンクをたどってページを(内容とかまで)キャッシュしたインデックスではなく、ページ内に存在するURLを「ガーッ」っと集めた中身の無いインデックスぢゃないのか??という疑問が出てきたりなんかしたわけです。
容量のないURLだけのキャッシュを見るとなんか疑っちゃいます。。
そうなると、キャッシュしたページ数はかぁーんたんに膨らますことは出来るが、200億ページのうちの一部(どれくらいかは、はてな)は中身は無いことになりゃせんかい??
ページ数だけ一気に増やしてそれぞれのページクロール&中身のキャッシュは徐々にしていくのではないかなぁ??
クロールするためのURLのリスト(それもかなり強引な集め方のモノも含め)さえページキャッシュだと言い張っているのではないか??
普通の検索結果にはほとんど出てこない。。URL直打ちの検索なら出てくる。。
なんとなくの勝手な予想です。まぁ、クロールの仕方とすれば順繰りにたどってクロール&キャッシュしますなんてことは言っていないわけだから、ロボットの種類というか性能というか動き方によってはこういう方式のほうが効率がいいのかもしれない。。ってかそれが普通なのかもしれないが(Google Sitemapsなんかのことを考えると。。)
また、勝手な予想と疑問だから200億ページのキャッシュに「容量のないURLだけのキャッシュページ」も含まれているかどうかも分からない。
しかし、少なくともそういう方式でのクロール&キャッシュだと前のエントリーでも書いたようにページ中のMETAタグを無視した状態でキャッシュすることもありうることになってしまう。
まぁ、どちらにしても総ページ数ではなく(だけではなく?かな)検索結果の質で争っていただけたらと思う。。自分のサイトが上のほうに来ればなおウレシ(爆。。
投稿者 こてつ : 17:43 | コメント (0) | トラックバック
rel="nofollow" の検証。。悩ます
ある程度、放置状態だった「rel="nofollow" の検証」。ある程度、各検索エンジンは当然のように表明通りの動きをしているようで、「なるほどなるほど」という感じだったのですが、均衡を破られてしまいました。
2005/09/29 07:07:12
lj2371.inktomisearch.com
68.142.250.181
Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
YAHOO!のロボットが来ちゃいましたよ。。?? 訳分からなくなるぢゃないか!!
なんてことしてくれるんだい!!
今のところ自分で検証用に作ったページからのみのリンクでリンクタグに「rel="nofollow"」を入れているわけですが、他の方がそこに向けてリンクを貼る訳でもないでしょうし。。
そうすると、「rel="nofollow"」があっても、リンクをたどってきたとしか考えようが無いわけで。。謎になってしまいました。
さらに謎なのは。。ロボットを確認するだけのページですので「noindex」にしているわけですが、YAHOO!にキャッシュされている。。7月16日付けで。。そんな日にアクセスされたログは残ってない。。キャッシュされているが 「0k(ゼロキロバイト)」 容量なし。。実際は3KB弱。なぞなぞ。。
「リンクをたどっていくことはしないけどリンクタグに書いてあるURLはキャッシュするよ」。。ってことだろうか??キャッシュされたURLには折を見て別途直接ロボット行きますみたいな。。そんな感じなのだろうか?
うぅ~ん。。訳分からん。
調べてみましたが、ロボットのアクセスを確認する為の「*.shtml」ファイルのうちのいくつかが同じように「noindex」にもかかわらず 同日 2005年7月16日 付け 「0k(ゼロキロバイト)」 容量無し(実際は3KB弱)でキャッシュされています。。
ページのMETAタグ(下記)を無視しているわけではないのではないか?また、METAの読み込み失敗とかでもないのではないか?。。
<meta name="robots" content="noindex,follow">
つまり、ページを読みに来てキャッシュしたわけではなく、どこかのページのリンクタグのみでURLをキャッシュしたため容量がゼロでMETAなんかは見てさえいないのだと考えると筋が通るように思う。
謎だぞ!やほお。。
投稿者 こてつ : 16:38 | コメント (0) | トラックバック
2005年09月26日
検索結果のユーザーレベルでのカスタマイズ
スパムサイトを検索結果画面から削除 - 登録ユーザーのカスタマイズをテスト中
こちらのエントリーを拝見した。googleで登録ユーザー向けには検索結果に現れるうちの不要ページを削除する機能のテストを行っている。。らしい。たしか米YAHOO!でも同じような機能があった。
米YAHOO!のものを、しっかり使いこなしたり、機能について詳細を確認したわけではないので概略です。
検索結果のうちのチェック要なサイトについて、必要なものとしてあるいは「Shared」共有される?ものとしてブックマークのようにされたり、不要なものとして「Blocked」することが出来るようです。ブロックしたサイトは検索結果から除外されましたので、上記で読んだgoogleのものと同じような機能だと思います。
但し、除外についてのハバ。。「1キーワードのみについて該当ページを」なのか「すべてのキーワードについて該当ページを」なのか「ドメインごとあるいは下層ページすべて」なのかは調べていません。。
この行動がGoogleに送信されるようになったら、一定数の得票を得たスパムサイトは、消去されるかもしれないが…
これは個人的には??です。やろうと思えばgoogle爆弾のような形で悪戯や嫌がらせのようなことも可能になってしまいかねないように思うのですがどうでしょう??。。登録ユーザーがグッドユーザーばかりであれば一つの削除指標にすることも可能でしょうが。。キーワードによってユーザー数、需要も供給もまたいろんな意味でのレベルもちがうわけですから「一定数」をどこに持ってくるのか難しい。。まぁ当然固定「一定数」ではなく各々いろんな条件加味した「ライン」になるのでしょうが、「ライン」設定大変じゃないでしょうか?そこにエネルギーを注ぐならストレートにgoogleサイドで検索結果調整すれば良いように思うわけです。。そういっても「餅は餅屋」とか「蛇の道は蛇」とかいいますが。。。
ただ、検索エンジンがこのような動きをしていることは確かなことです。
ユーザーが必要なサイト不要なサイトをいくつか登録しておくことによってそれに応じた検索結果を返す。。使用ユーザーレベルで異なる検索結果を表示することが出来るような「ファジー(。。死語だな)」な検索エンジンになっていくのでしょうか?ある程度見る目がある、判断できるユーザーは検索結果をカスタマイズできるようになっていくのかもしれません。。?!
投稿者 こてつ : 10:10 | コメント (0) | トラックバック
2005年09月15日
YAHOO!天気予報。。晴れ
「検索エンジン考」さんのところの「狼少年の無責任天気予報」
9月14日にはYSTのSERPsに変動がある。。
これをかなり期待していました。
それは、「inktomi系 大敗中。。」だったからです。
まぁ、単なるただの期待ではなく ある程度順位回復の自信はありました。
「同一ドメインからの同一アンカーテキストによる大量リンク」がペナルティーになるという噂ですがこれは、これが本当なら競合サイトを陥れることも可能といえば可能。ですから、あってもプラスマイナスゼロくらいかなぁなんて。。
ということで、感じ的には定説ではおこらないとされているが、ドメイン変更なしのサーバの移転のみでも順位転落はありえるのじゃないかなぁ。。なんて。キャッシュにDNSまで反映しているのか??ミラーサイトペナルティーを考えるともしかしたらありえるかも。。どうかな??
ということで、キャッシュがあたらしいDNSのものにほとんど入れ替わる頃には順位の復活が見込めるかなと思っていた。まぁ、BETA版移行の最中だったのでそれが影響した暴落だったのかもしれない。。ハテナだった。
で、うれしいことに天気予報はほぼ当たり!変動があって順位がぼちぼち戻ってきている。
いくつかのキーワードで。。
28位 → 1位
29位 → 1位
50位ランク外 → 1位
50位ランク外 → 4位
50位ランク外 → 5位
50位ランク外 → 6位
50位ランク外 → 6位
50位ランク外 → 12位
まぁ、暴落前はどれも1~3位くらいにあったものですから完全に満足ではないですが、良くぞ戻ってきてくれたってところでしょうか。この調子で順位が復活すれば、BETA版へ移行してもそうアクセス減少はしないかな。。
投稿者 こてつ : 20:54 | コメント (0) | トラックバック
2005年09月05日
怪しいロボット弾き
ふと、アクセスログを見ているとなんか怒涛にアクセスしてきているリファラのない「JavaScript OFF」なやつがいる。。何だコイツ?!ロボットか??
ユーザエージェントをみると。。
OmniExplorer_Bot/3.95 (+http://www.omni-explorer.com) WorldIndexer
IPアドレスは 65.19.150.229
。。Bot。。おめぇ絨毯爆撃系ロボットだろ!
ほんの数分の間に結構なアクセスをかけてきている。。いっかぁ~ん!調べてみましたが、素性もよう分からん怪しいやつ。弾きだ!弾き!!
大量アクセスの原因判明、「OmniExplorer_Bot」!こいつはアクセス禁止推奨です。
馬鹿ロボット OmniExplorer_Bot (www.omni-explorer.com/) をキック。
♪01.今日のくそボット
いくつかのサイトで出入り禁止になってるヤツのようです。ちゅう訳でうちにも来んなぁ!
.htaccess に一行追加しました
SetEnvIf User-Agent "OmniExplorer_Bot/" BadRobot
投稿者 こてつ : 23:22 | コメント (0) | トラックバック
My Yahoo! - RSSリーダー正式版
My Yahoo! - RSSリーダーがBETA版からいつの間にか正式版になっていました。
米YAHOO!は未だBETAのようですから日の方が早かったようですね。
検索フォームがちゃんとTOPに来たままになるようになったのが数日前ですから、そのときが正式版になったときでしょう。
自分的にはよく行くサイトの新着情報を得る為のRSSではなくて自サイトをクロールしてくれないかなぁ。。なんてあわよくばの淡い期待をこめて、自サイトの情報をRSSリーダー登録しています。。効果の程は。。不明です。
米YAHOO!のMy Web BETAにも登録?保存?してみたりしています。
My Web BETA - Yahoo!
まぁ、キャッシュするのは結構早いと思うブログなんかもあるのですが、いかんせん検索順位に不満があるんだようぅ!
inktomi系 大敗中。。
数日前から自サイトのほとんどでインデックス数の激変を確認。。しかも激減。。がっくし。
これは、検索結果変動の前触れだろうか。。元の検索結果!カムバーック!!
投稿者 こてつ : 15:00 | コメント (0) | トラックバック
2005年08月29日
『リンクを"購入"するな』。。?!
『リンクを"購入"するな』 - Google Matt Cutts氏
という記事を読んだ。。ぶっちゃけ個人的には?でした。「Web業界、広告業界はgoogle独り占めしたいんだよ」っというコメントにさえ聞こえてきそうだった。
AdSenseによる広告だって「検索順位」に関係なく目立つ部分にリンクを設けることができるがなぁ。。あれも金で買ったリンクだろうに。。暗にディレクトリやカテゴリの有料登録。。YAHOO!の事を叩きたいのだろうか??日本で言うところのJリスティングやルックスマートの有料登録のことでしょうか?まぁ、そういうシステムを筆頭に有料登録を行っているものは大量にあるだろう。。
直接的にではなくてもリンク登録を商売にした。。登録代行業者なんてものいるわけだ。ディレクトリ型検索エンジン等サイトを運営している側からすれば、こんな代行業者なんか相当ウザイわけだ。
いまや検索順位を金で操作できるようになってきている。ビジネスとして需要と供給が成り立つわけだから仕方が無い。『リンクを"購入"するな』といっても無理な話のようにも思うし、元をただせばこのようにさせたのも検索エンジンの順位のせいでしょう。。
PRという数字でサイトをランク付けしてしまったがために、PRが高いサイトからリンクをもらおうとするし、またそれが盛んになれば広告スペースとしての売買が始まるわけです。。人から見られることがなくても広告リンクの影響で検索順位に影響が出てくれば間接的に広告効果は上がるのですから。。
どこからが不正でどこからが正なのだろう???SEMは正?不正?
DMOZに金を出してでも登録してくれ!というサイト管理者はもしかしたら。。いやきっといるでしょう。
『リンクを"購入"するな』。。なんて無茶な注文をしたらあかんよ。。っと思うわけだが。。
投稿者 こてつ : 00:09 | コメント (0) | トラックバック
2005年08月26日
ロボット弾き
あんまりいらない。。ってか、メールアドレス収集に来ているロボットや、なんか怪しいロボットなんかはクロールしに来なくていいっちゅうねん!!
参考にさせて頂きました。
先日「大量クロール制御を考える」で行った robots.txt の設置。
まぁほぼ同じくして上記を参考に 「.htaccess」 にもロボット制御。。というかアクセス制御の項目を追加しておきました。
「拒否ユーザーエージェント・IPアドレス一覧」←ほぼ、こちらに沿って設定しています。
悪名高き?!NAVER は先日終了のお知らせがありました。クローラーもいなくなるのでしょうか??ってかもういない??新サービスの方が新しいクローラーロボットを発進していたりして。。
なんかヤッターマンのゾロメカちっくです。まぁ、そんなにゾロゾロやってくるのはgoogleくらいかもしれませんが。。
改めてロボット含めた総アクセスログ解析してgoogle多いことにびっくりしました。結構激しいかも。
ところで、参考にした「robotはぢきについて」ですが、最初勝手に「robotはちぎについて」って読んでました。。あほ。
もう自分の中ではウザイロボットはちぎっては捨てちぎっては捨て。。こんな感じを勝手に想像。。(W
投稿者 こてつ : 09:31 | コメント (0) | トラックバック
2005年08月25日
inktomi系 大敗中。。
先日、妙な検索コメント「混雑しています。。」を吐き出していたYAHOO!ですが、数日後その状態からも復活しました。しかし、期待していた検索結果の変動はほとんどなくガッカリでしたね。
ある程度の結果は見えていましたが改めてキーワードでの順位チェックしてみました。
使ったツールは
検索キーワードチェックツール
です。
上位を目指しているいくつかのキーワードで検索すると。。GoogleやMSNでは期待している結果がでるもののinktomi系は最悪です。キーワードによってはランク外。。しょぼーん。。
何があかんのかなぁ。。サーバの引越しが影響しているのか?それともYAHOO!(inktomi系)自体の検索結果変動が影響しているのか?。。ナゾです。。どちらも同時期だったからなぁ。
まぁ、それなりにSEO対策しているわけですがスパム判定されるほどかなぁ。。ってか他の検索エンジンとの差がありすぎじゃぁなかろうか。。YAHOO!カテゴリに登録されている部分もあるのに!おかしいぢゃん!!さらに言うと、それまではinktomi系でも同じくらいの上位だったんぢゃい!!
今は、登録されているカテゴリからそれなりに訪問されていますが、
Yahoo! のダイジェスト表示は 9 月まで?
こんな感じでカテゴリ表示がなくなったらゾッとするわけです。。あと1ヶ月。。
投稿者 こてつ : 13:53 | コメント (0) | トラックバック
2005年08月16日
URLを統一する(wwwあり・なし)
「ホームページのURL」で書いたように、URLはどれかに統一しておくほうがいいということです。
参考:「第1回 http://www.su-jine.com/とhttp://su-jine.com/は同じ?」
まぁ、何の気なしに一応そうしておいたわけです。実感がわかなかったもので。。
しかし、先日 ふとURLを手入力してみると!!
なんとも。。実感できました。(PRは8/16現在)
http://www.yahoo.co.jp/ (PR:8/10)
http://yahoo.co.jp/ (PR:6/10)
http://www.goo.ne.jp/ (PR:8/10)
http://goo.ne.jp/ (PR:6/10)
http://www.excite.co.jp/ (PR:7/10)
http://excite.co.jp/ (PR:5/10)
http://www.livedoor.com/ (PR:7/10)
http://livedoor.com/ (PR:4/10)
。。ぇっ!YAHOOさん、gooさん、エキサイトさん、ライブドアさん。。
そんなことでええんかいな??もったいない。。
(あんまり多くは試していないですが)wwwあり・なしでPRに差が出ているのを見たのは初めてかもしれない。。ってかメジャーなところがそんなこと。。気づかないぢゃん!
やっぱりちゃんとどちらか一つに統一するかちゃんと転送するか、しなあかんなぁ。。
怖い怖い。。いや、もったいないもったいない。
投稿者 こてつ : 14:42 | コメント (0) | トラックバック
2005年08月13日
妙なYAHOO!
先日の妙なクローラーに引き続き今度はYAHOO!の検索結果表示が妙だ。
URL検索をすると通常キャッシュされているページがどれくらいあるか見れるわけだが、「混雑しています。。」というメッセージが出て結果が表示されない。
「検索エンジン考」さんのところでも「Yahoo! JAPANの不審な動き」で確認されているように、一部の検索でSERPsが表示されないようです。
自分の管理するHPで 4/6 の割合で「混雑」のメッセージが出ています。6つのうち3つはカテゴリーにありますのでカテゴリーのみ表示されてますが。。
残りの2つのドメインとの違いが分からないですね。。まぁ、少なくともただ単に混雑しているわけではないように感じます。何か更新しているような。。
願わくば、米YAHOO! に準じた検索結果になることを望みます。。
「同一ドメインからの同一アンカーテキストによる大量リンク」がペナルティーになるという噂ですが、これにあたっているのか日YAHOO!だけ思惑通り上位表示されないページが3つ~5つあります。
Google、msnは結構いけてるんですが。。それまでは1~3位にあったのに、YAHOO!だけ先日の変動で消え去りました。。(泣
投稿者 こてつ : 20:41 | コメント (0) | トラックバック
2005年08月09日
妙なクローラー。。
最近(といっても先月くらいから目だってかな)やたらと inktomi系のクローラーがやってくる。。正確には普通に他のクローラー、ロボットもやってきていると思うのだが、こいつはなんかちょっと変だ。
何故変かというと。。
・SSI式じゃない普通のアクセス解析(JavaScript+IMG式)で捕まえることが出来る
・キャッシュを頻繁にアクセスしている??
ということです。他のクローラーは生ログやSSIで解析するのが一般的だったと思うのだが、この inktomi系(lj2000系)は普通のアクセス解析に頻繁に顔をだす。変なヤツだ。JavaScript は OFF だが。。まぁ、こいつに限らず、たまぁーに捕まえることが出来るクローラーもいるが。。。なんかユーザエージェント値偽装でもしているんぢゃないかなとも疑ってみたくなったりもする。
あと、http://souko.web.infoseek.co.jp/blog/ から http://mook.jpn.org/ へ引っ越したブログですが、一応古いアドレスから .htaccessで転送かけています。ファイルも削除してアクセスできないようになってます。 で、古い方と新しい方とアクセス解析を分けてますが、どうもこの lj2000系 は古い方のキャッシュに頻繁にアクセスしてやがる。。何がしたいんだ??
「古い記憶も掘り起こせ!」的なクロール作業でもやってるんでしょか?なんだか妙なクローラーです。
Yahoo系のSEO考察について。。参考にしている。。
「lj系クローラーの大量来襲」
投稿者 こてつ : 13:40 | コメント (0) | トラックバック
2005年06月20日
Google Sitemaps(beta) ちょっぴり厳しく
「サイトマップをGoogleに提出。。ウマァー?!」でエントリーしましたサイトマップ提出。
少し、登録URLが厳しくなったようです。
開始当初(。。といってもすぐに登録してませんが)は登録するxmlデータは書式さえ適合していれば特に問題なく「OK」となっていました。
しかし、少しチェックが厳しくなったようです。
xmlのサイトマップデータがある場所と異なるドメインのURLや上層にあるファイル、URLはエラーとなってしまいました。
とあるMovable Type 用の Google Sitemaps テンプレは提供サイトのURLを差し込んでいましたがそれはエラーになるということです。。残念でした。
自分で作った Yomi-Search 用のテンプレもルートに入れるため2度手間ながら手作業でコピー修正しました。ルートでディレクトリ作成してなかったもので。。
投稿者 こてつ : 00:33 | コメント (0) | トラックバック
2005年06月07日
サイトマップをGoogleに提出。。ウマァー?!
いろんなところで紹介されていますので御存知の方も多いでしょう。
「Google Sitemaps(beta)」
サイトのURLを。。つまりサイトマップをGoogleに提出することによりクロールの取りこぼしを
減少させるというもの。
つまりはピラミッド階層なんかは深くクロールするのを失敗したり忘れたりするので
キャッシュされたかったら並列のサイトマップをくれよ~。。てなところでしょうか
早速 blog の Google Sitemaps 用テンプレ使ってみたり、 Yomi-Search のテンプレ
作ってみたりしてサイトマップxmlデータ作って登録してみました。
それが効いたか定かではありませんがいくつかのサイトで Google でのキャッシュが
増えました。アドレス表示のみでされていたページも増えつつありましたが若干減った
ように思います。
ちょっと気になるのはせっかくURL登録に画像文字認証を追加したのに Google Sitemaps
というのをはじめたことです。ロボットによる大量登録を弾く為かと思っていましたが、
大量URL登録が可能になるということですよね。。?
また、Google Sitemaps を使用する人が増えると登録URLがそれだけ増えるためクロール
不足はまたまた出てくるということではないでしょうか??
<参考>
Google Sitemaps グーグル・サイトマップ(ベータ版)FAQとプロトコル全訳。新しいURL登録方法はSEOに必須になる?
Sitemap Generator 使い方について少し詳しく書いてありました。
。。しかし分かりません(爆 Python ってなにぃー??コマンド実行がよう分かりまへん
Google SitemapsのMovable Typeテンプレート完全版
投稿者 こてつ : 20:25 | コメント (0) | トラックバック
2005年05月28日
HTMLでトラックバックする
Su-Jineさんのところで
「HTML でトラックバック」
という記事を拝見しました。
ブログツールを使わずに普通のHTMLのページをトラックバックするというものです。
試しにひとつやってみましたがいけてました。HTML→MovableType へのトラックバックもできました。
いいかんじです。いい感じなのですが、かなりの懸念があります。
トラックバックスパムです。TESTの段階ですでに宣伝っぽいトラックバックがありましたが、これが普通のブログに乱発されるのが怖いです。すぐ普及しそうな気もします。
非常に有効なものですので利用する人次第というところですが、紹介リンクや参照リンクなしに行なうトラックバックスパムに近いものでHTMLの場合(普通pingを受ける機能を実装されていないので)トラックバックを返せません。故意ではないにしてもホントにスパムになってきちゃうかも。
いままでトラックバックが使えなかった宣伝したいHPで某女性タレントのブログや某野球選手のブログにトラックバックをするものが増えたりして。。怖いです。
投稿者 こてつ : 12:39 | コメント (0) | トラックバック
2005年05月13日
検証の経過報告
先日エントリーしました「rel="nofollow" の検証」
エントリーを見た人がリンクをたどって閲覧するのは当然除き、ロボットが来た場合に経過報告を行おうと思っていました。
まぁ、たまにやってくる正体不明なやつは置いておいて。。
2005/05/12 23:24:19
crawl-66-249-65-47.googlebot.com
Mediapartners-Google/2.1
調べてみましたが、どうもAdsense関係のロボットのようです
Su-Jineさんのコラム「Mediapartners-GoogleはGooglebotの役割を持っている?」
また、What's new?/Diaryによると
1.AdSenseを貼っているページでGETメソッドを使用した(=AdSenseがあるページで
アンカー(リンク)をクリック)
2.OperaでGoogle提供の広告を表示しているときGETメソッドを使用した(=レジスト
していないOperaを使ってアンカーをクリック、またはアドレスバーにURIを入力したり
ブックマークからWebページを開いたり)
ということらしいです。ほうほう、確かにOperaでのアクセスがあるぞい。そういうことか。
Googlebotがキャッシュしに来たわけじゃないのだろう。。
投稿者 こてつ : 14:37 | コメント (0) | トラックバック
2005年05月01日
rel="nofollow" の検証
コメントスパムやトラックバックスパムのリンクを、検索エンジン的に無効にするという「rel="nofollow"」
Google、Yahoo!、Microsoftの3社が採用を表明しているそうです。
rel="nofollow"の属性を埋め込むことによって、検索エンジンはクロールしない、またはインデックスしないということになるそうです。またGoogleなど外的なリンクをページの重要度に加味するPageRankなんかも影響しないようになるようです。
。。ホントに無効になるのか??実験君。実験君。
「rel="nofollow"」の検証リンク
まぁ、「rel="nofollow"」でクローラーがクロールしないかどうかぐらいの検証です。
また、どんなクローラーが来るかは確認できると思います。Let's トライ!
投稿者 こてつ : 18:01 | コメント (0) | トラックバック
2005年04月26日
ALT属性は検索キーワードとしてヒットするか?
ということで、Su-Jineさんが検証していたものです。
画像にはALT属性で、(画像を表示しない)テキストブラウザ用にその内容や説明を入れるようになっています。「なっています」というのは、<img>のALT属性はHTML4.01では必要な属性となっている為です。ですので入っていない場合、HTML文法チェックなどで、かなり厳しい減点が行われてしまいます。
話が少しそれました。
リンクをする場合等やキーワード率を増加さたりSEO対策でもALT属性は利用されていますが、検索時のキーワードとして認識するか?という検証・実験だったわけです。
[2004/09/19]段階では、ALT属性にいてられている語句で検索してもヒットしなかったそうです。。そうですっちゅうか自分でも確認してみてヒットしなかった記憶があります。つまりALT属性を検索キーワードとしては認識していなかったと推測されます。
ヒットしました!ALT属性を検索キーワードとして認識したのでしょう。アルゴリズムの変更でしょうか?
キャッシュの浸透の仕方とかでしょうか?詳細は分かりませんがALT属性をSEOに利用するのが再び?!多少有効になったといえるのかもしれません。Yahoo!とmsnはだめでした。
少し前には、検索結果がALT属性を加味したものとそうでないものとに系統が分かれたというような話もなかったでしょうか??
。。ありました、「更新・アルゴリズムの収束間近?」
この辺ぢゃないかな??
もうひとつ、該当キーワードのことでSu-Jineさんとこの掲示板にも2/19頃に話題にあがっていました。
まぁ、色々書いてますが ぢゃどうやねんて言われると「さぁ?」といっておきましょかい
投稿者 こてつ : 13:04 | コメント (0) | トラックバック
2005年04月13日
dwodpの改造
こちらでも行ったdwodpの改造。
アクセス解析を行っていると結構検索してGM:dwodpに来ていらっしゃるようですが、
実際Yahooから自分で見てみると本体部が空っぽ。。こりゃだめぢゃん
Googleからはいいようですが。。
どうもYahooにキャッシュされたURLは最後のスラッシュがないものになっていて
そこから飛んできてもプログラムが認識しないのが問題のようです。
前に行った、さくらレンタルサーバ仕様のdwodp@PATH_INFO。
ここで追加した変数 $c を判別してやって
$c_end=substr($c,-1);
if ($c_end != "/") {
$c=($c."/");
}
else {
$c=$c;
}
これを入れてやってもよかったですが、他に設置しているdwodpと同じにしておきました。
dwodpの改造と同じところです。
こちらもYahooから検索で飛んできてもちゃんと表示されるようにはなったようです。
投稿者 こてつ : 11:26 | コメント (0) | トラックバック
2005年03月28日
Google URL登録時に文字認証コード
いくつかのサイトでやはり書かれていたので迷っていましたが書きます。
先日、enの方では確認していましたGoogle URL登録時に文字認証コード
ですが日本語の方にも採用されました。
Google、URL登録にセキュリティコード導入
Google サイト登録時のサブミッションコード
当方でも確認していたのですが、サイト登録を登録業者に頼んだりしていないので
そんなに気にしていませんでした。
「URLの登録」でも書いたように、一発登録・自動登録などのプログラム的なものは
排除しようということなのでしょうか。
自分の見解では、お金をかけて登録作業を依頼するならYahoo!のカテゴリ登録を
したほうがいいとは思ってます。
あとひとつ、サイトのキャッシュ状況ですがGoogleにしてもYahooにしてもリンクが少なく
クロールする頻度が望めない場合はたとえ一度キャッシュしてもしばらくして忘れちゃう
ことがあるようです。忘れられる前に再キャッシュしてもらうのがキモです。
ですから、キャッシュしてほしいページには道をたくさん作るようにしています。それから
頻繁にタイムスタンプ更新しています。
投稿者 こてつ : 14:33 | コメント (0) | トラックバック
2005年03月05日
Googleの動き
GoogleでのURL登録(en)が色々と動いているのでしょうか??
新しいリンク先になりました。
以前は
http://www.google.com/addurl/?hl=en

こちらだったわけですが画像認証が不評をかったのでしょうか??
ちなみに日本語版のほうも2つのURLが存在します。
http://www.google.co.jp/addurl/?hl=ja
http://www.google.co.jp/intl/ja/addurl.html
「静的」「動的」の違い程度なのかそうでもないのか、詳しいところは僕には
分かりません。
片方はいずれなくなるのかもしれません。。
リンクをたどってロボットに来てもらっている場合はあまり関係の無い話題でした。
他にも新しいバージョンのToolbarもベータ版が出ているようですし
検索結果もかなり不思議な状況です(だいぶ落ち着いてきてはいるようですが)。
Su-JineさんのところでToolbar3ベータ版での ch 値が以前と違ってきているとの
ことですが、余り意味を成さなくなってきたPageRankの改善でもするのでしょうか?
その改善を取り込んだ今回の検索結果の変動だったりするのでしょうか?
ナゾですねぇ
投稿者 こてつ : 10:57 | コメント (0) | トラックバック
2005年03月03日
URLの登録
検索エンジンにGoogleやYahoo!やmsnなどありますが、どのようにHPを
インデックスしてもらっているでしょうか?
普通はディレクトリに登録したり、相互リンクをおこなったりしてロボットの来る
道を作ってあげるのが多いとは思います。
まさにリンクという縁がないとなかなかロボットは来てくれません。
ただ、どれくらいの確立でロボットを呼べるか不明ですがURLの登録という
方法もあります。
Yahoo!(要ログイン)
http://submit.search.yahoo.com/free/request
Google
http://www.google.co.jp/addurl/?hl=ja
http://www.google.com/addurl/?hl=en
MSN(beta)
http://beta.search.msn.co.jp/docs/submit.aspx
http://beta.search.msn.com/docs/submit.aspx
ロボットなのにロボットからの一発登録などは受け付けなくなりつつあります
ログインが必要だったり、画像認証が必要だったり。。
3.28 追記 - 7.28 追記
MSN追記しておきます。日本語の方betaぢゃなくなるのはいつでしょう。。
6月下旬に正式版に移行していましたが追加するの忘れてました。。
MSN
http://search.msn.co.jp/docs/submit.aspx
http://search.msn.com/docs/submit.aspx
'05/4/1 さらに追加
Su-Jineさんところの掲示板で見つけました。
enは知ってましたがjpもあったとは。。
YAHOO!JAPAN(要ログイン)
http://submit.search.yahoo.co.jp/add/request
'06/3/14 さらにさらに追加
Su-Jineさんが上のようなURLの登録フォームなどがきちんと機能してサイトクロール、登録しているか検証されているようです。。リクエストした米YAHOO!も追加されています(W
YST, msn, Google の URL 申請ページは機能しているのか (2)
自分の経験では米YAHOO!の登録も「どこからもリンクされていなくてもインデックスされる」ような気がします。実際にそういうページ(ほぼ完全に独立したサイト。。但し、そのサイト間だけでリンク。。ようは、外からのリンクを辿ってのクロールは無い。。)を管理しています。
投稿者 こてつ : 13:20 | コメント (0) | トラックバック
2005年02月28日
HTML構文チェックをやってみた
こちらのサイトでも前にやったHTML構文チェックをやってみた。
「良縁ネット」のTOPは少し前にチェックしていて大体修正し
W3CのOKは出るところまではしておいたのですが。。
Yomiのディレクトリは最悪でした。。
まぁ、またまたこつこつやってある程度のところまでできたわけですがスタイルシートの読み込み
<link rel="stylesheet" href="<?=$EST['html_path_url']?>style.css" type="text/css">
がどうしてもbody中に入って困ってました。
いろいろネットで調べて(簡単に書いてますが結構大変でしたがね)
モジュールのスタイルシートをヘッダに読み込ませる処理を追加しました。
●yomi\header.php
// headタグ内出力
$xoopsTpl->assign("xoops_module_header",
'<link rel="stylesheet" href="http://good-match.net/modules/yomi/html/style.css" type="text/css" />
');
を追記しました。 ただし使っているテーマのテンプレートファイル(theme.html)の
<head>~</head>内に <{$xoops_module_header}> という記述がいります。
(僕の場合最初からありましたので。。)
href=のあとは変数?にしておきたかったですが何にしていいか分からず絶対値
を入れちまいました。
他のところもコツコツ修正し、だいたい構文チェックOK!ではないでしょうか
まぁ、100点にはこだわらないんです(爆。