本日の投稿では、「ランク付け要因としてのリンク」の4番目の調査の結果を紹介します。私たちは2016年5月にこれらの研究の最初のものを実行し、リンクの役割における重要な変化を測定するために時間とともに同じ質問セットを追跡してきました。今年の調査では、リンクの役割が市場セクターによって異なる可能性があるかどうかを確認するために、さまざまな市場セクターについても調べました。

また、時間の経過とともに調べているクエリの数も増えました。私たちは、市場部門の分析が意味をなすのに十分なデータがあることを確認するためにそれを行いました。各調査の月の内訳、および1調査あたりの調査数は次のとおりです。

2016年5月 – 6Kのクエリ
2016年8月 – 16Kのクエリ
2017年5月 – 16Kのクエリ
2018年8月 – 27Kのクエリ

各クエリデータセットには、以前の調査の元のクエリセットが含まれているので、これらの結果と、今年度の調査の大規模な結果を比較してみましょう。おまけとして、MozのLink Explorerの範囲と品質の向上についてもコメントします。

結果
これまでの研究と同様に、リンクエクスプローラーにアクセスして研究のためのデータを取得できるようにすることで、Mozからの素晴らしいサポートを受けました。リンクエクスプローラーは2018年3月にベータ版に入り、インデックスのサイズを拡大するためのMozによる野心的な努力を表しています。つまり、成功したように見えます。

グラフは、2016年8月から2018年8月までの間にモズの索引付けがどのように改善されたかを示しています
ランキング要素としてのページへのリンク数
リンクスタディ自体については、最初に表示されるチャートのセットはランキングページを指すリンクの総数に基づいています。これらのために、我々は二次平均相関スコアを計算した。方法論のセクションにジャンプして、「二次平均スピアマン相関スコア」の値が実際に何を意味するのかを確認します。これまでに実行した調査の4つのインスタンスすべてにわたる6Kクエリのデータを以下に示します。

hartは、2016年5月から2018年8月までの6,000回のクエリのランキング係数として、リンクの2次平均相関を示していますこのチャートに対する同じ6,000のクエリが4つのデータセットすべてで使用されていることに注意してください。これはある程度の低下を示しているように見えますが、現実には、この動きは通常の統計的分散内にあります。すべての意図と目的のために、これはすでにそのページへの合計リンクとそのランキングの間に強い相関関係を示しています。

2番目の調査から始めて、クエリ数を16,000クエリに増やしました。私たちはその同じ16Kの質問のセットを今年度のこの研究版まで持ち込みました。16Kクエ​​リのこれら3つのデータセットの相関スコアは次のとおりです。

グラフは、2016年8月、2017年5月、および2018年8月の16,000回の問合せに対するランキング係数としてのリンクの二次平均相関を示しています
繰り返しますが、3つのセットすべてが強力な結果を示し、分散は統計的分散の正常範囲内にあります。

今回の最新版では、クエリ数を27Kクエリに更新しました。これは同様に堅実な価値でもたらされます。

グラフは、2018年8月の27,000のクエリに対するランキング係数としてのリンクの二次平均相関を示しています
新しい調査によると、ページへのリンク数はランキングと高い相関があります。
クリックしてツイート
より注目すべき発見の1つは、私たちが行ったすべての研究で初めて、総リンク数よりもMoz DAとMoz PAのほうがランキングの予測因子として優れているということです。これに関するデータは次のとおりです。

グラフは、2万7000回のクエリに対する2018年8月の総リンク数に対するMoz DAおよびMoz PAの2次平均スピアマン相関を示します
新しい研究によると、@ moz DAとPAはランキングとさらに高い相関を示しています。
クリックしてツイート
問合せタイプ別のランキング係数としてのページへのリンク
以前の研究と同様に、コマーシャルクエリと情報クエリの合計リンク相関を比較しました。

チャートは、2万7000のクエリについて、2018年8月の二次平均スピアマン相関対コマーシャル対情報クエリを示しています
新しい調査では、情報クエリは商用クエリよりもランク付けとやや相関が高いことを示しています。
クリックしてツイート
市場区分によるランキング要因としてのページへのリンク
次に、今年の調査では、リンクが市場セ​​グメント間のランキング要因としてどのように変化するかを評価しました。この最初の見解では、医療、金融、技術、その他のセグメントに分けられた商業的な質問に対するそれを見てみましょう。

チャートは2次平均スピアマン相関を示します – 27,000の質問に対する商業質問セクター分析
新しい調査では、金融市場のセグメントが他のセグメントよりもリンクの方が検索ランキングに優れていることが示されています#seo
CLICK TO TWEET
このデータは、他の種類のクエリよりも、金融クエリの方がリンクがはるかに高いランキング要素であることを示しています。しかし、それについて最終的な結論を出す前に、情報クエリに対するセクター分析についても見てみましょう。

チャートは27,000回の質問に対する二次平均スピアマン相関情報質問セクター分析を示している
正規化リンク数によって集計されたランキング係数としてのリンク
最初の研究から始めて、正規化されたリンク数もランク付け位置によって集計しました(それが何であるかの説明については下記の方法論のセクションを参照してください)。

この見解が重要である理由は、関連性と品質が、そうあるべきものとして、非常に大きなランキング要因であるということです。さらに、SERPの多様性を示すためにGoogleが必要とすることなど、他にも多くの要因があります(これについての詳細は、「なぜ非集約相関値が高くないのか」というセクションをご覧ください)。集約リンク分析では、多数の検索結果にリンクが広がっていることの影響を要約したビューを得ます。これが、4つの研究すべてにわたる6Kのクエリーセットを見たものです。

6,000クエリの順位によるランキングリンクスピアマン相関
これは、過去3回の調査における16Kのクエリーセットのデータです。

16,000回のクエリの順位による集約リンクSpearman相関
これがこの最新の研究用の27Kクエリセットのデータです。

27,000回の質問に対する順位付けによる集約リンクSpearman相関
要約すると、私たちの集計されたビューはリンクとランキングの位置の間の非常に強力な相関関係を示しています。

Googleの主要なランキングの要素はどのように相互作用しますか?
これを理解したい理由はたくさんありますが、ランキング要因としてのリンクに関連して、非集約Spearman相関スコアがなぜそれよりも高くないかを理解するのに役立ちます。

次のように、これが当てはまる理由は2つあります。

1. 関連性とコンテンツの品質が大きな要因:最も単純な形式では、Webページがクエリに関連性がない場合、ランク付けされるべきではありません。それは、もちろん、明らかです、しかし議論はそれよりずっと微妙です。例として、クエリのランク付けに十分考慮される10個のコンテンツがあるとします。さらに、このような「関連性スコア」(RS)があるとしましょう。

関連性スコアに基づくランキングを示す表
これは表面的にはかなり良いランキングのアルゴかもしれないようです。最も関連性の高いコンテンツを最上位にランク付けしています。私は自分の関連性スコアを非常に狭い範囲に設定していることにも気付くでしょう。それは理にかなっています。つまり、関連性がないのであれば、ページやサイトを指すリンクの数に関係なく、ランク付けしないでください。

問題は、適切な単語を入力するだけで、コンテンツの断片を非常に関連性の高いものにすることが非常に簡単で、最も関連性の高いコンテンツが実際には非常に貧弱な情報をユーザーに与えることです。それでは、品質スコア(QS)と呼ばれる新しいスコアを追加しましょう(この用語のAdwordsバージョンではなく、実際のページの品質の有機的評価)。それがアルゴリズムにどのように影響するかを見てみましょう。

関連性と品質スコアに基づくランキングを示す表
これは改善のようですが、おそらくそうです。ここでの問題は、関連性の測定と同様に、品質の測定は難しいことです。それでは、ミックスにもう1つ要素を追加しましょう。それは、リンクスコア(LS)です。それを活用して、「市場全体」に、このトピックでどのコンテンツが最も適しているかを示します。これは次のようなものです。

関連性、品質、およびリンクスコアに基づくランキングを示す表
3つのシナリオの間でランキングがどのように変化したのでしょうか。かなりかなりです。このGoogleのアルゴリズムの単純化されたモックアップでは、リンクが非常に重要であることは明らかです。表示されている3番目のシナリオのランキング要因として、リンクのスピアマン相関を知りたいですか。0.28です。

これはGoogleのアルゴリズムを大幅に簡略化したものですが、これに基づいても、なぜ非常に高いSpearmanスコアを達成するのが難しいのかわかります。

2. 他のアルゴリズムが登場する:私が話しているアルゴリズムの種類の例は次のとおりです。

ローカル検索結果
画像結果
ビデオ結果
クエリは多様性の結果に値する
これらは私たちの結果の15パーセントに影響を与えるかもしれません。説明のために、上記の例を取り、Query Deserves Diversityを使用してランキング位置の1つだけを変更し、1つの高得点の結果が単一の項目(結果番号3)に置き換えられるとします。

他のGoogleのアルゴリズムによる影響を受けるランキングを示す表
この例では、3番目の結果を別のアルゴリズム(Query Deserves Diversityなど)からのものに置き換えました。この結果のランキング要因として、リンクのSpearmanスコアにどのような影響があるか知っていますか?それは0.03に落ちます。痛い!

うまくいけば、これはなぜ0.3の範囲のスコアがリンクがランク付けにおいて非常に重要な要素であることの指標であるかについてあなたにいくらかの直感を与えるでしょう。

リンクスパムとの闘いにおけるグーグルの進歩
ランキング要因としてリンクが減少していると言う人々は、リンクを獲得し、彼らのサイトに値しないランキングを獲得するために違法行為を使用しようとするスパマーによる努力をしばしば指摘しています。彼らはこれがグーグルがもう戦う必要がないことを望んでいる戦いであると言いたい。これは確かに2002年から2013年までの時間帯におけるグーグルにとって大きな問題でした。しかし、この戦いの流れは2012年に始まりました。

その年の間に最初に起こったことは手動の罰則の波がグーグルによって評価され始めたということでした。それ自体で、これらはすでにSEO業界を通して衝撃波を送りました。次の大きなステップは、2012年4月24日にPenguinの最初のバージョンをリリースすることでした。これはGoogleにとって大きな前進でした。

今後数年間、Googleは新しいバージョンのPenguinを使用するためのアプローチと、違法なアプローチを使用してリンクを取得する人々への対処方法を洗練するための手動ペナルティの組み合わせに重点的に投資しました。これは、2016年9月23日のPenguin 4.0のリリースで最高潮に達しました。

Penguin 4.0のリリースにより、リンクへのアプローチに対するGoogleの信頼が高まり、Penguinのアルゴリズムでは不適切なリンクを取得したためにサイトを罰することがなくなりました。Penguin 4.0以降、アルゴリズムは単に悪いと判断したリンクを識別し、それらを無視します(ランキング値を持たないようにします)。

悪いリンクでサイトにペナルティを課すことからそれらのリンクを単に割引することへのこのシフトは、Penguinがそれが見つけるように設計されている悪いリンクの非常に大きな割合を見つけているというGoogleの自信を反映しています。

もちろん、ペンギンはアドレス指定を目的としていないと人々が使用している違法なリンク構築の慣例に対処するために、依然として手動ペナルティを使用しています。

Googleは実際にどの程度進歩していますか?私はSESシカゴで2008年12月に座ったBlack Hat / White Hatのパネルを今でも覚えています。一緒にいたのはDave Naylor、Todd Friesen、そしてDoug Heilでした。何人かのパネルメンバーは、Webサイトのキャンペーン開​​始時にリンクを購入することが必要条件であり、SEOプロがそうしないことは無責任であると主張しました。

10年間で物事はどう変わるのでしょう。どんな場所のどんなSEOもリンクを買うことは賢いやり方であると主張してから長い年月が経ちました。実際、Googleのウェブマスター向けガイドラインに違反するリンクを取得する方法について一般に推奨されている人はいません。そのようなことをするための業界全体が地下に追いやられてきました。

地下走行は「なくなった」と同じではありませんが、問題を見つけて検出するGoogleの機能が非常に効果的になったことを示しています。

最後のポイント、そしてそれは重要なことです。答えは簡単です。リンクは主要なランク付け要素であり、ガイドラインに合わないリンクを取得するためのスキームはそれらが重要な要素であるためです。積極的に対処したい。そうでなければ、彼らはリンクスパムとの戦いに投資する必要はないでしょう。

なぜリンクは価値あるシグナルなのか
Googleはまだリンクを使用しているのはなぜですか。なぜ彼らは単にユーザーエンゲージメントシグナルとソーシャルメディアシグナルに切り替えないのですか?ここでこれらのシグナルが問題になる理由全体を説明するつもりはありませんが、それぞれについて簡単に説明します。

ソーシャルメディアの信号:2つの主な理由:(1)グーグルは、競合他社によって運営されているサードパーティプラットフォームからの信号に依存することはできません(グーグルとフェイスブックは友達ではありません)。(2)FacebookやLinkedInなどの主要なソーシャルメディアサイトは、いいねやシェアに関するデータの共有をやめました – ソーシャルメディアサイト自体がこれらのシグナルに価値がないと判断した場合、検索エンジンはなぜ必要なのでしょうか。
ユーザーエンゲージメントシグナル:Googleはおそらくこれらのシグナルを何らかのシナリオで使用する何らかの方法を見つけますが、それらができることには制限があります。これが彼らの機械学習チームの責任者、Jeff Deanが次のように述べたものです:「より面倒な強化学習の問題の例はおそらく私が検索結果を示すべきものにそれを使用しようとしていることです。さまざまなクエリに対応して表示できる検索結果のセットははるかに多くあります。また、報酬のシグナルは少しうるさいです。ユーザーが検索結果を見てそれを気に入ったり好まなかったりしても、それほど明白ではありません。」
しかし、今度は、問題の核心にたどり着きましょう。それは3つの主要なポイントに降りてくる:

リンクを実装するには、あなたが重要な投資をする必要があります。あなたはウェブサイトを所有しなければならず、あなたはウェブページにリンクを実装するために時間をかけなければなりません。これは大した投資ではないかもしれませんが、ソーシャルメディアの投稿にリンクを実装するよりもはるかに努力が必要です。
あなたがリンクを実装するとき、あなたはあなたがリンクしているウェブページであなたのブランドを識別する公の承認をしています。さらに、それは静的です。それは不朽の方法でそこに座っています。対照的に、ソーシャルメディア投稿のリンクでは、それは人々のフィードから素早く消えました、時々ほんの数分で。
あなたのサイトのページにリンクを実装すると、人々はそれをクリックしてあなたのサイトを離れるかもしれません。実際、あなたは彼らにそうするように誘っています。
リンクあなたのサイトを離れて人々を招待する
最後のものについてもう数秒考えてみてください。あなたのサイト上の(非広告)リンクは、あなたがそのリンクがあなたの訪問者にとって十分な価値があり、それらの訪問者とのあなたの関係を強化するのに十分であるとあなたが考えるというあなたによる表示です。あなたが他の人にあなたの元を離れても構わないサイト。

それが、リンクを非常に価値のあるシグナルにしている理由です。

基本的な方法論
最善のアプローチ(Paul BergerとPer Enge)について2、3の専門家と相談した後、私は私たちの研究におけるすべての質問の結果についてSpearman Correlationの計算を実行し、そしてそれらのスコアの二次平均をとりました。これを行う理由は、相関変数の2乗を利用するためです(相関値はR、2次平均はRの2乗を使用します)。

統計的に意味を持つのは、実際にはRの2乗値です。たとえば、Rが0.8の場合、Rの2乗は0.64であり、Yの変動の64%はXによって説明されると言えます。ポールバーガーが説明したように、相関変数Rに関する意味のある文はありません。しかし、Rの2乗は相関関係について言うのに意味のある何かを与えます。

これは、この計算プロセスがどのように機能するかを視覚的に示したものです。

ランキング因子としてのリンクの二次平均計算
さまざまな計算方法に加えて、さまざまな種類のクエリを組み合わせて使用​​しました。私たちは、コマーシャルヘッド用語、コマーシャルロングテール用語、そして情報クエリもテストしました。事実、私たちの質問の3分の2は情報的なものでした。

追加のアプローチ
個々の相関の平均と2次平均の両方のアプローチが有効であると思いますが、これらのアプローチの限界の1つは他の要因がランキングアルゴリズムを支配し、信号の強度を見るのを難しくすることです。

そのため、私は他のいくつかの方法で分析を行うことにしました。これらの最初のものはリンクをより集約された方法で測定することでした。これを行うために、各結果のリンク数を正規化しました。これが意味するのは、あるクエリの各ランキング位置のリンク数を計算し、それをそのクエリの最大リンク数で割ったことです。

その結果、各クエリの最大のリンクスコアは「1」の重みになります。これを行う理由は、膨大な数のリンクを含むいくつかの結果を持ついくつかの照会が、結果の計算に過度の影響を与えることを防ぐためです。

それから私達は各ランキングの位置によるすべての検索結果のためのリンクの合計を取りました。これに対する方程式は、次のようになります。

順位をランク付けして総リンクを使用して相関を計算する
これの価値はそれが異なった方法で否定的な相関の影響を滑らかにするということです。上記のように、他のランキング要因の影響を緩和すると考えてください(関連性スコア、コンテンツスコア、および他のアルゴの影響)。これは、上記の「順位による集約リンク相関」のデータに示されている計算です。

私はまたこれをもう一つの方法で見た。このビューでは、引き続きリンクの正規化合計を使用しましたが、それらをランキンググループ10にグループ化しました。つまり、上位10の正規化リンク合計を合計し、順位11〜20、21〜30についても同様にしました。などです。次に、相関を計算して、各10ポジションブロックでランク付けするのに必要なものに関して、それらがどのように見えるかを確認しました。

これらの計算は、次のようになりました。

SERPの10ブロックで相関を計算
これにより、すべてのランク付け位置を単純にSERP位置に集約するよりも、もう少しきめの細かいアプローチが得られますが、それでも、平均相関法の制限の一部が解消されます。それが上記の「10個のブロックの集合リンク相関」データに示されているものです。

 

北九州の八幡西区 エステ ならリッチリッチへ