DeNAのキュレート問題報告書はSEO視点では貴重な資料

DeNAのキュレート問題報告書はSEO視点では貴重な資料

本bitWaveは今年1月に創刊丸2年を迎え、現在3年目を邁進しています。

そんな中、DeNA社が運営していたキュレーションメディア「WELQ」を始めとしたいくつかの媒体で、正確性を欠いた記事・盗用とおぼしき記事が確認されたことで、ネットメディア界隈ではちょっとした騒動が続いております。

この騒動が立ち上がってから三カ月、DeNA社より『第三者委員会調査報告書の全文開示公表のお知らせ』なる報告書の開示があったことを社内メンバーから共有を受けました。
貴重なデータが載っていて参考になるとの報告を受け、まずは最初から目を通すことに……。

超大作の報告書ですね……。
株取引をしている方であれば有名なブログ「市況かぶ全力2階建」でもネタにされていましたが、全文276ページ(しかも目次と付録だけで29ページも!)の大作を読むのは中々しんどいですね。
要約版』というものも用意されているようですが、それでも全34ページ。。。

このボリューム感から見て、報告書自体は完全オリジナルであることが伺えます(笑)。

報告書のある表に着目

キュレートの問題、コピペやその他各種法律に関する問題はこの騒動のいわば本丸であり、他所でも散々語られ尽くしていると思うので、本記事ではあえて割愛します。

第三者委員会調査報告書の全文開示公表のお知らせ』では前記の本丸にあたる問題の課題と原因について事細かく記載がされているのですが、注目すべきは各メディアごとの運営やKPI含めた具体的なデータが時系列で開示されている点になります。これはメディア運営者にとって非常に有益な情報なのではないでしょうか。
ここでは「iemo」「MERY」「CAFY」「Find Travel」「JOOY」「cuta」「WELQ」「GOIN」「UpIn」「PUUL」の10サイトのSEO施策の変遷と、記事数PVの関係性、その推移表について分析していきます。

まずは『第三者委員会調査報告書の全文開示公表のお知らせ』内に掲載された表をご覧ください。
PDFでいうところのP97、P114、P130、P143、P151、P159、P175、P190、P197、P206ページになります。本記事と報告書内の表とを比較しながら読み進めていただくことをオススメいたしします。
(※本来であれば該当表組をキャプチャ転記しようとも考えたのですが、コピペ問題の報告書をコピペするのは如何なものか!?(笑)という抵抗と葛藤があり、転記はあえて避けております。ご了承ください)

なお、PDF内に頻出してくる用語について、以下に注記しておきます。


DAU

Daily Active Usersの略。Web上では一日の訪問ユニークユーザを指す

SEO DAU

報告書では検索由来のDAUを指す

月間公開記事数

その月に新規投稿された記事数を指す

累計公開記事数

累計された公開記事の総本数を指す

ダウパ

記事本数÷DAU(記事あたりのユーザ訪問数)


この中で着目すべきは、一般的に聞きなれないワード「ダウパ」です。
もう少し平たく言うと記事の平均ユーザ数です。これは記事数が多い際にサイト全体がSEO的にうまくいっているかを確認する上で便利な指標となります。
(※「ダウパ」という表現は抵抗感じますが、今回はDeNA社発表のこの表現で統一します)

一般的なSEOとDeNAの特殊な事例

通常のSEO施策では以下のようなやり方が一般的な手法となります。
手順①:キーワードの設定
手順②:タイトルの設定
手順③:①②に対して適切な構成と構造を最適化する
手順④:公開時の発信の最大化
手順⑤:検索順位をトラッキング(数カ月要する)
手順⑥:チューニングを図っていく

CMSを使った場合は「手順③:構成と構造を最適化」と「手順④:発信の最大化」は自動化できます。
そしてDeNA社ほど膨大な記事を保有することになると「手順⑤:検索順位をトラッキング」と「手順⑥:チューニングを図っていく」を継続して実践し続けることはほぼ不可能になります。

つまりSEOで勝負できる場所は「手順①:キーワードの設定」と「手順②:タイトルの設定」しかなく、ここに注力することになります。
はっきり言ってしまうと、この2つの設定とCMSの仕組み化ができてさえいれば、SEOをディレクションしている人は、“記事内容に介入する必要も無く” SEO対策が可能というわけなんですね。

Googleは記事数に比例して評価が高まる傾向

現実問題として、Googleの検索エンジンは(騙す気はまったく無かったとして)この黄金律さえ守っていれば、特定のキーワードで上位に入ることが可能になります。

勘違いしてはいけないのは、検索上位に入るといっても、どんなに良くても「メチャカリ 使ってみた」などのワードで1位になるレベルで、一般的な記事は月に10未満のDAUしかない記事が大半です。いわゆるロングテールというやつです。
つまり、ほとんどのケースでは「10%の記事が残りの90%の記事と等価値」ということになります。

ヒット記事を定期的に産み出すことができるのであれば掲載記事数は少なくても済みますが、そこはライバルの居る世界。そんなに甘くはないです。それでもCMSを最適化してあれば、あまり深く考えずにDAUを上げることができるのです。

とても検索されないような何かのワードでも上位をとれば、「一人の人が関心を持った事象は、世の中に100人くらいは同調する人間がいるもんだ。」という思考で、「検索でも同様の行動を示す」から、いつかは検索されるのです。

ということで検索による引き上げはソーシャル活動より効率がいいので、SEO依存によるサイトが出来上がるという構図です。この過程は報告書にも多く言及があります。

「iemo」と「WELQ」にみる投稿数至上主義

例えば「iemo」の場合、当初は記事をSNSで発信し、ユーザの共感を得るスタイルのサイト運営方針(報告書:P94参照)だったようです。しかしながら、コミュニケーション基本の集客は効率は悪く、徐々にSEO依存型に変化していったようです。

2014年10月時点では全体のDAUが169,300に対してSEO DAUが26,400
この結果から検索に依存せずSNS集客に注力していたことが伺えます。しかし、ダウパはすこぶる悪く5.2となっており、コミュニケーション基本の集客方法に限界を感じていたのは確かでしょう。

それが2016年には全体のDAUが1,176,200に対して、SEO DAUが786,518
総記事数は49,943まで膨らんでおりダウパは15.7となっています。

「WELQ」の場合はもっと衝撃的です。
2016年1月の全体のDAUが81,100に対してSEO DAUが72,100総記事数7,148
それが同年11月には全体のDAUが2,800,000に対してSEO DAUが2,500,000総記事数は35,190まで膨らんでおり、ダウパは驚異的な71.2(!)を叩き出しています。

他と比べても異常な数値の上昇の仕方。
すなわちここにGoogleの検索のアルゴリズムとの関連性があり、Google検索のスパム対策の限界と言われる点です。

「WELQ」はなぜダウパが急増したのか?

DeNA社が運用していた10サイトそれぞれの計測開始時(必ずしも創刊時とは限らず)と最終計測時のダウパを以下にまとめてみました。


「iemo」 報告書(P097)

内容/ 「インテリア」に関するキュレーションメディア
開始ダウパ/ 5.2(2014/10)
最終ダウパ/ 15.7(2016/11)
差分/ +10.5

「MERY」 報告書(P114)

内容/ 「女性ファッション」に関するキュレーションメディア
開始ダウパ/ 24.4(2014/10)
最終ダウパ/ 6.0(2016/11)
差分/ -18.4

「CAFY」 報告書(P130)

内容/ 「食」に関するキュレーションメディア
開始ダウパ/ 1.2(2014/12)
最終ダウパ/ 27.6(2016/11)
差分/ +26.4

「Find Travel」 報告書(P143)

内容/ 「旅行」に関するキュレーションメディア
開始ダウパ/ 14.9(2015/02)
最終ダウパ/ 26.8(2016/11)
差分/ +11.9

「JOOY」 報告書(P151-152)

内容/ 「男性向け情報」に関するキュレーションメディア
開始ダウパ/ 4.2(2015/04)
最終ダウパ/ 23.4(2016/11)
差分/ +19.2

「cuta」 報告書(P159)

内容/ 「妊娠・出産・育児」に関するキュレーションメディア
開始ダウパ/ 6.6(2015/06)
最終ダウパ/ 19.0(2016/11)
差分/ +12.4

「WELQ」 報告書(P175)

内容/ 「医療」に関するキュレーションメディア
開始ダウパ/ 0.7(2015/10)
最終ダウパ/ 71.2(2016/11)
差分/ +70.5

「GOIN」 報告書(P190-191)

内容/ 「カーライフ」に関するキュレーションメディア
開始ダウパ/ 0.2(2015/10)
最終ダウパ/ 17.2(2016/11)
差分/ +17.0

「Upln」 報告書(P197)

内容/ 「節約・投資・保険」に関するキュレーションメディア
開始ダウパ/ 0.5(2015/10)
最終ダウパ/ 25.8(2016/11)
差分/ +25.3

「PUUL」 報告書(P206)

内容/ 「エンタメ情報」に関するキュレーションメディア
開始ダウパ/ 1.2(2015/10)
最終ダウパ/ 23.0(2016/11)
差分/ +21.8


10サイト中9サイトで上昇。そして「WELQ」が突出していることが確認できます。
報告書を読む限りではGoogle検索の癖を肌感で知る人が、あえて “禁じ手” を使った感があります。

その “禁じ手” とは、特定のキーワード上位10位の記事項目・要素を網羅する形で記事作成をするというものです。DeNA社の場合、DeNAサイト群からの被リンクという圧倒的な優位性がある分、必ず検索上位になるというカラクリがあるのです。

では、この手法がなぜ “禁じ手” とされるのでしょうか。

一般の読者であればキーワード検索した上で、検索結果上位の記事を読む傾向にあります。新規で記事を作成する場合はそれに被らない視点で記事を書くのが基本で、記事を書く人へのアドバイスも「コピー、著作権侵害と誤認されますので、検索で簡単に出るような言い尽くされた既知の事実を書かないでください。」というのが普通です。

しかしその真逆を行き、あえてネタと展開を被せていくことで上位を狙うこの手法。

正直、これで上位を取られると敵を作りまくりですね。非難の的にされても、擁護すべきところがないのも確かです。
それでもGoogle検索の最適化という点では、2016年もまだキュレートが最強であったことを証明しています。ただし、「Naverまとめ」のようなキュレートが検索評価が高いことは度々問題視されており、こうした事態に陥ることは想定できていたかもしれませんね。

着眼点は一緒でも、過程がこうも異なるものか

コンテンツサイト、メディアサイトを運営するなら、「WELQ」創刊当時のアプローチ方法である「“上位” の分析とワードの選択」は必ずするでしょうし、調査もします。ここまではbitWaveでもまったく同じ手法を採用しています。正しいアプローチでしょうし、記事を書く人全員に推奨できることです。

その上で、検索上位になるためには「網羅性」「独自性」「ユーザ視点」の3つから記事を書く必要があります。当然ながら「書く技術と知識」が必要になりますし、それを実現させるための「入念な準備」が重要になります。
しかし「書く技術と知識」の部分を「WELQ」は仕組み化しようとし、間違った方向へと進んだようです。

「WELQ」ではキューレートを促進し、「キーワードの網羅性のみを高める」ように組織が動いていたようです。
本来であれば執筆するために必要な工程である「入念な準備」においても手間を省くことを推奨し、クラウドソーシングのライターたちにリライト方法を提示するようになっていました。
ただひたすら機械的に記事をコピーし、リライトを行う。出来上がった “新規” 記事には “新規” たる要素が欠落し、サイトはただの類似記事生産工場と化していました。

これが著作権のみならず、薬事法や医療関連のモラルハザードを起こす最大の原因になったのです。
結果としてSEOの分析は正しくても、まったく異なる状態を作ったのです。

いつか来た道。Googleパンダの発端

このSEOの記事問題。しかし、Googleにとって初めての経験という訳ではありません。
実は似たような経験が過去にはありました。さかのぼること6年前の2011年、SEO業界を震え上がらせたGoogleによる「パンダ・アップデート」が登場した契機でもあります。

この「パンダ・アップデート」が実行される前、文字数さえ稼げば他サイトからのコピーコンテンツであろうと、低品質な内容であろうと検索上位になる傾向があり、Googleの検索品質に対する信頼が低下する一方でした。
それを防止するために “記事品質” を重視した結果、実施された施策が「パンダ・アップデート」になります。しかしこのアップデート自体が万能というわけではなく、初期の精度はお世辞にも高いと言えるシロモノではありませんでした。それでも当時は、随分と「掃除された」と感じたものです。

これが徹底されているのであれば、今回のDeNA社のキュレート問題にも効果を発揮しそうではありますが、「言い回しのリライト」や「文章構成のシャッフル」、「ワードの前後入れ替え」が頻繁に行われていたためにGoogleサイドでは「低品質」とも「コピーコンテンツ」とも検出できなかったようです。

そしてWELQアップデート……、よくよく考えれば一周回って元の位置に

Googleは低品質な情報を検索上位に表示させていた責任を感じてか、結果的として「WELQ」をはじめとするキュレーションメディアへの制裁とも取れるアップデートを行うに至ります。
Googleは固有名詞の発言こそ避けていますが、一般的にこの変更は「WELQアップデート」と呼ばれているようです。
<参照:Googleウェブマスター向け公式ブログ『日本語検索の品質向上にむけて』>
<参照:netgeek『【速報】Google検索がWELQアップデート。キュレーションサイト終了へ』>

Googleの公式見解として、以下のような一文があります。

オリジナルで有用なコンテンツを持つ高品質なサイトが、より上位に表示されるようになります

しかし、アップデート内容の詳細やその新アルゴリズムは不明です。
前記の「パンダ・アップデート」を実施した時もそうでしたが、よくあることです。SEO的には。
詳細が明かされないことで、日経BPさんとかに “SEO業界の闇” とまで書かれてしまう訳です。

これら “SEO業界の闇” 系の詳細なり動向を追いたいのであれば、様々な制約に縛られた記事よりもSEO業界屈指のエンジニアと呼ばれ、いろんな意味で光を照らしてくれそうな辻さんのツィッターを追った方が有益な情報が得られるのではないでしょうか?

<参照:Twitter『辻正浩 | Masahiro Tsuji』>

「パンダ・アップデート」の時もそうでしたが、今回も「ペルソナ重視・役に立たない記事は記事じゃない」的な視点に立つと、アルゴリズム変更に恐怖もしないし、大喜びでもありません。

実際、bitWaveも僅かながらの恩恵は受けた(数%ほどDAUが上がった)ようですが、複合的な施策もしているので、それが果たして「WELQアップデート」の恩恵であるとは言いきれない……、そのくらいの変化でしかありません。

真っ当なメディア運営をされている方であれば、みなさんも同じように考えることでしょう。

元も子もない話「そもそもWELQ以外はダウパが低すぎるよね」

最初にこの報告書を読んで気になったのは、問題視されている運用方法以上に「ダウパ低すぎない?」ということでした。かろうじて「WELQ」が標準より少し良いレベル。このbitWaveですら(失礼w)70です。

あれだけ膨大な数の記事を書いて(=リライトして)、記事投稿して。さらには課せられたノルマの中で色々消耗して……。
この結末はともかく、あの程度の結果しか得られなかったのでは浮かばれません。かなりストレス溜まりまくっていただろうなと、中の人の心情を勝手に察してしまったりします。

消費型コンテンツが多すぎたんですかね?
方向性が極端に間違っていたことは確かですが、そのエネルギーの半分でもダウパ高める方向に持っていけば、また違った展開になっていたのかもしれませんね。
とはいえ、どっちにしろ「WELQ」は記事自体に嘘がありダメでしたが。

1サイトの月間投稿数1000~2000って多すぎる

1カ月1000本の投稿であれば43.2分に1本、2000本の投稿であれば21.6分に1本。。。
この数を見ると思うのは、「死んでまう」「ネタが尽きる、ゼッタイ」「アイキャッチ専門デザイナーが必須」「そもそも読んでいる時間=生きてる時間にならないか?」とネガティブな発想しか出ません。

本当に必要だったのかを検証する余裕もなかったんでしょうね。
「WELQ」ではリライトのリライトをする作業もあったようで、SEO的評価こそ高まっていたようですが、扱うネタがアレすぎましたね。

最後にbitWave編集員の意見を聞いてみましょう

ここまではSEO担当者のコメントですが、SEO視点ではなく記事視点からのコメントをこの人から聞いてみたいと思います。

『本件に携わってしまったライターたちへ』

by 約みつる(bitWave編集員)

まずは本件に携わってきたクラウドソーシングのライターの方々、お疲れ様でした。

私は音楽関連で4年、そしてモータースポーツ関連で7年と、10年以上も出版・編集業務に携わってきました。それ以前はアマチュアながらフリーペーパーを8年ほど。つまり “超” が付くほどの編集バカです。
ですから、いくら単価が安くても編集に携わりたいという気持ちは痛いほど分かるつもりです……。

“ディレクターの言われるがまま” にコピペ・リライトをされた方々も、仕事を選んでいられない事情があったのかもしれません。それでもライティングに魅力があってその生業を選択したのでしょう。それだけになおさら、その記事作成方針を受け入れ続け、記事を量産してきたライターの方々にあえて言いたい。
「バカヤロー」と。

昨年、モータースポーツ誌で共に苦楽を味わった編集者仲間が14年間勤めていた出版社を退社し、フリーランスのライター兼カメラマンに転身しました。今までと変わらず世界各地を股にかけ、モータースポーツの魅力を発信し続けています。カッコイイっす、H君。

そんな彼が昨年末、Facebookで現況の憤りを爆発させていました。

「近頃はキュレーションメディアと称する媒体が誕生していて、明らかに著作権法に違反しているものがあります。画像を他所から引っ張ってきて、どこかで読んだ知識をさも自分が取材したかのように書いて収入を得ているようですが、言語道断です。媒体としての収入・支出を完全に無視して、収入だけを得ようというものだからです。ちなみに、日本で最もアクセスがあると言われている某F1情報サイトも、著作権侵害を繰り返しています。うまく捕まらない仕組みを作っているのが最悪です」と。

彼は1文字10円とか、写真1枚数千円という業界に生きており、自サイトやSNS上で無断転用されてしまえば、それだけで収入源をカンタンに失ってしまいます。この状況が長く続くようではいくら志が高くとも、仕事を変えなければならなくなる日がいずれ訪れるのです。
情報発信者を志すクラウドソーシングのライターたちが、実際の情報発信者を根絶やしにしようとしている状態。罪の意識がなかったとしても、それは蛮行以外の何ものでもありません。

Googleが打ち出した呼称「WELQアップデート」は遅きに失した感は否めません。
しかし、この状況を打開できるのは検索エンジンだけであり、そのトップランナーであるGoogleだけでしょう。この「WELQアップデート」が、かつて隆盛を極めたブラックハットSEO(自動被リンクツール)などを駆逐した「パンダ・アップデート」同様の効果をもたらすことを期待するばかりです。

閑話休題。
ライターの方々、今後は信念を持ってその文才を活かしてください。安請け合いしないでください。
そしてクラウドソーシングのライター達から、真の情報発信者が生まれることも期待しています。

コメント