🍄 Дон Шампиньон [aka Lord_Alfred]
2.29K subscribers
16 photos
67 links
Хитрожопый дорвейщик. Сборник мыслей о Black SEO и иже с ним.
Делаю говно-сайты (doorways), паразитирую на чужих ресурсах, пилю софт для всего этого и зарабатываю так себе на безбедную жизнь.

Блог в vk: https://vk.com/lord.alfred
Download Telegram
💪 Как-то недавно в чате скидывал способ передачи языка браузера на страницу преленда из Keitaro TDS v6, а сейчас подумал что и сюда тоже стоит запилить. Авось кому-нибудь из староверов (потому что v6) тоже пригодится и поможет чуть улучшить конверсию по другим языкам нехитрыми манипуляциями.
Смотреть как это делается здесь: https://gist.github.com/lord-alfred/e6f9fb4bebd28bd234fce684be121fa9

👳 К слову, много ли из вас юзают преленды на разных языках?
🏋️‍♀️ И кто-нибудь держит что-то кроме Keitaro, zTDS, Sutra TDS и CPA Tracker?
🏋️ Примерно месяц по паре часов в день я пилю легковесную CMS под большие нагрузки и огромное количество доменов, которые она должна обслуживать. Не буду сильно вдаваться в технические характеристики, но всё будет реализовано на php7+LMDB+nginx, что по моим нагрузочным тестам вывозит более 2.5к RPS(!) без кэша, а с кэшированием и больше 3 тысяч запросов в секунду спокойно держит на 4 CPU Cores / 4 GB RAM / SSD. Там внутри всё достаточно сильно оптимизировано, да и архитектура изначально прорабатывалась очень долгое время, чтобы избежать bottleneck'ов, но посмотрим как будут дела в продакшене 🙂 Если кому-то интересно, то могу потом подробнее написать обо всём с графиками из overload (Яндекс.Танка).

🤔 И в связи с тем, что уже скоро подходит время запуска - я озадачился выбором VPS, где это всё будет находится. На старте не хочется вкидывать деньги в топку и покупать дедик, т.к. все DCMA free варианты с SSD диском стоят как 2-4 VPS с хорошей конфигурацией. А тестовые пачки нужно запускать с наименьшими усилиями, чтоб если что - потом просто удалять сервер и забивать, а не заниматься переносом доров и подсчётом "какой домен сколько трафика даёт". Выстрелила пачка - отлично, оставляем сервер и платим за него дальше; не выстрелила - в топку его .

🔥 Многие ВМы покупают VPS и ориентируются только на заявленные характеристики, а по итогу хостер может адски оверселлить и вы по факту будете платить за худшие характеристики. И чтобы узнать не попалил ли вы на нагруженную ноду - придумали бенчмарки. Но какого-то хрена днём с огнём не сыщешь результаты из бенчей. Есть несколько сайтов, кто публиковал их у себя, но там они или устарели или нет хостеров, которые интересны.

👉 Поэтому было решено по фану сделать канал в Telegram, куда будут выкладываться ваши бенчмарки с вашими реферальными ссылками: @VPSBench
Идея донельзя простая: вы запускаете у себя бенчмарк, копируете результаты и присылаете их вместе с рефссылкой. А я публикую это в канале, сделав небольшую выжимку. Возможно, в дальнейшем эта идея перерастёт во что-то большее, но сейчас как MVP (прототип) - канал в телеге, по-моему, является идеальным решением, чтоб стартануть и проверить работоспособность идеи. Да ещё и польза всем от этого будет 🙂

👾 Сейчас там уже опубликованы несколько моих бенчмарков и бенчей от друзей, вот лучшее из того что протестировано:
Servercheap: https://t.me/VPSBench/9
DigitalOcean: https://t.me/VPSBench/6
ITLDC: https://t.me/VPSBench/7

😜 Ну что, надеюсь вас заинтересовала идея получить рефералов на халяву всего лишь пробенчив свои VPS? Тогда велкам:
Forwarded from VPS Benchmarks
Вы делаете бенч на своей VPS - мы постим вашу реферальную ссылку. Всё просто: https://bit.ly/2RrmUCW

Чтобы "пробенчить" VPS нужно всего лишь выполнить в ssh команду:
curl -LsO https://raw.githubusercontent.com/laset-com/speedtest/master/speedtest.sh; bash speedtest.sh


После окончания - скопируйте ВЕСЬ (обязательно первую строку с версией + последние строки с Share results) вывод из консоли и запосте его на pastebin.com , а затем пришлите результаты через форму: https://bit.ly/2RrmUCW
🤔 Всегда хочется получать больше профита с трафика без его увеличения. А в моменты, когда гугл «кошмарит» и срезает от 20% до 70% переходов — эта тема становится ещё более интересной и востребованной.

Именно поэтому я написал большую статью о замере и улучшении конверсии. Пересылай это сообщение коллегам, если им это пригодится! 😜

https://vk.com/@lord.alfred-conversion-improvement-metrika
💆‍♂️ Осенью на Zenno-форуме появился раздел с бесплатными шаблонами, куда команда ZL выкладывает различные полезные и простые проекты (регеры, постеры, парсеры). И там же есть запрос на создание новых шаблонов, где через голосование определяется что они выложат ещё. И как-то давно я попросил запилить парсер товаров и отзывов с Amazon (потому что самому не хотелось ковыряться, а тут такая прекрасная возможность делегировать, да ещё и без оплаты), а они взяли и сделали 😛

🤠 Правда, я был бы не я, если бы в момент допиливания того проекта не решил переделать всё практически с нуля 🙃 Когда сделал - понял, что чего зря добру пропадать - работает он стабильно, данных тащит гораздо больше чем базовый шаблон - и выложил свою реализацию в ту же ветку: https://zennolab.com/discussion/threads/parser-tovarov-i-otzyvov-s-amazon-get-post.70842/ (доступ только клиентам).

🤔 В целом есть мысли зайти в товарку с дорами и посмотреть как там. Правда, вроде понятно что лить через белый преленд на амазон скорее всего затея чреватая постоянными банами афф акка, поэтому присматриваюсь к паре других магазинов поменьше, у которых есть партнерские программы. И вот как раз в целом интересно было бы пообщаться с теми, кто уже "в теме" и пилил доры под бурж товарку. Может быть есть такие камрады у меня в подписчиках? 😉
😵 Machine Learning, 👹 Глубокое обучение, 🤕Бустинг, ☠️ Кластеризация и 🤖 Классификация. А также другие страшные слова, которые всем интересны, но так лень разбираться в сложных научных публикациях...

🤜 Наткнулся на статью, где это всё объясняется простым языком и без километровых формул:
https://vas3k.ru/blog/machine_learning/
🤕 После прихода BERT - гуглопоиск потерял часть хвостов из НЧ-запросов, но это не главная беда. Ещё одна задача, с которой успешно справляется данная нейронная сеть - это предсказание логичности текста. То есть он с высокой точностью может определить на сколько у вас согласованы предложения в тексте между собой, а не просто нахерачена мешанина сниппетов или "марковка". (Сразу сделаю тут disclaimer: значимость текста в разных нишах - различается)

☠️ Многие уже зареклись и начали уходить из дорвеев, потому что всё и идёт к тому, что Google с его TPU v3 Pod (в которой больше 100 петафлопс мощности и 32ТБ(!) оперативной памяти, а таких подов - целые фермы) тренирует какие-то дикие решения на основе ответов асессоров и рано или поздно он выкатит это в виде Core Update. Погуглите ради интереса какая мощность у вашего ПК/сервера, которым вы генерите доры и сравните во сколько раз ресурсы гугла превосходят ваши...

🎖 Думаю, в этом нет ничего страшного и оно скорее закономерно (уже десять лет твердят "в дорах денег нет"), но ведь для кого-то оно так и есть. И логично, что с каждым годом уровень входа повышается (хотя хватает и "везунчиков"), но прогнозировать масштабируемость тех или иных действий крайне сложно уже несколько лет подряд.

🏊 Поэтому те, кто ещё на плаву и пытаются бороться - ищут всё новые решения, которые помогут взобраться на вершины Google-Олимпа. И я не исключение. В связи с этим мой рисёч сейчас нацелен на готовый парсер, который сможет с очень большой вероятностью извлекать контент из html-страниц. Вроде логично, что это задача не решается с высокой точностью, но приемлимые результаты должны быть. И вот блуждая по просторам наткнулся на прекрасный доклад Михаила Коробова (автора pymorphy2, разработчика из ScrapingHub, автора множества полезных OpenSource-решений). Те, кто со мной на одной волне - оценят междустрочные идеи, которые там рассказаны:
https://www.youtube.com/watch?v=l11caoD_MFc
🌚 Решил попробовать новый формат: раз в неделю буду публиковать топ ссылок, которые могут заинтересовать мою аудиторию, то есть вас (ведь мы на одной волне? 😉). Потому что очень много всего интересного замечаю вокруг, а идеи - ничего не стоят, ими можно делиться для общего блага. Всё равно не хватит сил и времени запилить даже половину из этого. Да и сложно "рождать" крутые решения хоть в сколько-нибудь стабильном режиме, поэтому лучше годнота от меня будет не часто, а вот мысли головы постараюсь вливать в блог стабильнее. Зачем ему простаивать?)

🦄 Формат сильно экспериментальный, поэтому очень жду от вас фидбека!

📈 Наш "хитпарад" начнут несколько нововведений в выдаче Google.
Не так давно они выкатили в поиск фавиконки у сайтов, причём задизайнили это визуально так, что блоки рекламы (для выдачи на английском) не сильно отличаются от обычных результатов, поэтому народ поднял баттхёрт на этот счёт: https://vc.ru/103120 - вроде даже корпорация пообещала провести тесты и найти более оптимальный вариант. Хотя арбитражники, наверное, кайфанули от повышения CTR после выкатки этих изменений (или CTR не апнулся?).
А ещё в некоторых тематиках в выдаче адовое количество эмоджи: https://t.me/devakatalk/2032 - выглядит это дико, но каждый (даже белый сеошник) использует из всех возможностей максимум в условиях конкуренции.

🔦 Очень в тему сейчас будет перейти к Bing'у. Я вообще не видел чтоб кто-то про это писал (может про😶бал), но этот хитрый поисковик начал использовать тот самый страшный BERT ещё раньше, чем его официально выкатил гугл у себя в поиске: https://azure.microsoft.com/en-us/blog/bing-delivers-its-largest-improvement-in-search-experience-using-azure-gpus/
"Starting from April of this year, we used large transformer models to deliver the largest quality improvements to our Bing customers in the past year" - и как раз есть информация из неподтвержденных источников о том, что в бинге в апреле знатно трясло выдачу (кто в курсе, инфа достоверна? 🤔).

🏃‍♂️ Да и в целом Mircosoft, конечно, молодцы - у них очень сильный отдел по AI. На днях вышел релиз о том, что они смогли ускорить работу BERT в 17 раз (там немного читерство в цифрах, но оставим это на их совести): https://cloudblogs.microsoft.com/opensource/2020/01/21/microsoft-onnx-open-source-optimizations-transformer-inference-gpu-cpu/

🐿 А ещё оказывается, что гугл кроме разработки своих мощнейших TPUv3 - вкладывается в разработку барби-сайз TPU-чипов, которые могут решать узкоспециализированные задачи, но зато они дешёвые и их можно присрать куда-то к себе (например, в self-driving гироскутер, гг): https://coral.ai/products/

🦂 Начало 2020 года ознаменовало то, что изо всех щелей кричат про агрегаторы и статьи-обзоры. "Вон, в выдаче весь топ забит ими!11 Давайте тоже делать их или лучше соберём по 100 рублей и закажем свой агрегатор агрегаторов!!!" - как-то только упускается тот факт, что даже если и есть какой-то высокий коэффициент при ранжировании таких сайтов с самого начала, то он явно не будет длиться вечность. И пока все раскачаются - всё может сдохнуть (а может и не сдохнуть, фриномы весь 2019 год топ засоряли).

🎲 Ну да ладно, кто-то ведь пишет и годноту про агрегаторы. Например, Игорь Рудник рассказал про весьма интересную идею куда можно податься арбитражить, если есть навык и рука намётана: https://t.me/rudnyk/22
Вкратце: у некоторых крупных агрегаторов и подобных сайтов есть свой РК, где можно купить траф, который идёт с поиска и приходит уже достаточно горячим, чтоб шкворчать у вас в виде звонкой монеты.

🏆 Михаил Щербачев поделился мыслями о ранжировании внутри этих самых агрегаторов: https://t.me/mflow/306 - основной посыл в том, что сейчас там нет того самого рокет дата саенса, а алгоритмы на уровне гугла из тех самых времён, когда "доры были живы".

🇮🇳 Как складно получается переходить с темы на тему в этот дебютный пост! Недавно Google обновил свою инструкцию для асессоров: https://static.googleusercontent.com/media/guidelines.raterhub.com/en//searchqualityevaluatorguidelines.pdf
(читай далее...)
(... продолжение)
Не знаю многое ли там поменялось, но вроде бы предыдущий русскоязычный перевод ещё актуален (писал о нём тут: https://tgme.pro/lord_alfred/11)

👨‍🚒 У devak'и (Сергея Кокшарова) недавно вышел гостевой пост с разбором чек-листа для YMYL-сайтов: https://devaka.ru/articles/ymyl-checklist - когда видишь такие инструкции, то всегда хочется взять и нахерачить по ним доров 🤠

🐴 Но вот с дорами последнее время у многих есть ощущение, что они идут по проторенной дорожке и именно из-за этого нет резкого буста трафика. И как раз для таких людей я наткнулся на полезные мысли о том, что делать, если лошать сдохла, а вы всё ещё скачите на ней: https://t.me/subjectivno/137 (прочитал? знакомо? 🤣)

🚽 Иногда те, кто (благодаря своей эрудиции) находят хитрые схемы - по факту могут спалить её случайно, слишком подробно расписав своё ТЗ. Так было с новичком с зеннолаба, который наткнулся на продажу купонов с одного крупного немецкого интернет-магазина. А получить их можно было если писать отзывы, но жаль что после этого убьют тему: https://zennolab.com/discussion/threads/72397/

🤖 Раз речь зашла о ZennoPoster, то грех не упомянуть что MicroSoft (ога, снова эти ребята) выпустили в опенсорс проект Playwright - либу для node.js, автоматизирующую браузеры Chrome, Firefox и движок WebKit: https://twitter.com/aslushnikov/status/1220045633282662401
Конечно, мы не говорим о том, что там есть хотя бы 1% функционала, доступного в ZP. Даже какие-нибудь простецкие фингерпринты для аудио или канваса там не перегенерировать. Но тем, у кого есть бюджеты и задачи фармить аккаунты для какого-нибудь Google или Facebook - это всё может оказаться весьма приятным стартовым решением.

🤯 И тут стоит упомянуть, что команда разработки Cliqz (форк FF с уклоном в приватность) завела блог и пишет там статьи о том, как они (внезапно) пилят поисковик: https://0x65.dev/
Всякий харкод присутствует в немалых масштабах, поэтому если у кого-то из читателей есть желание докопаться до истины как оно там внутри гоняет биты - будет полезно почитать (статьи на английском).

📖 К слову, о "почитать на английском" - в октябре Алексей Трудов сделал аналог топсапы для буржунета: https://t.me/im_for_all/155
Я вот эту новость пропустил, хотя и не особо интересуюсь зарубежными SEOшниками.

🤪 Под конец ещё хочу посоветовать два крутых tg-канала, где (почти всегда) человеческим языком стараются рассказывать о новых научных публикациях, связанных с искусственным интеллектом: @tldr_arxiv и @gonzo_ML

🙃 PS: чет дофига вышло, сам не ожидал что столько всего за неделю накопилось.
Чтоб вникнуть в каждую идею и разобраться со всем - сохраняй данный пост к себе в избранное! Как появится время - дочитаешь и осмыслишь мои старания 😉
Ну и это... лайк и репост, если зашло! 👍
🎶 Что-то я угорел, да написал несколько частушек на злободневные темы. Если вам зашло - отправляйте друзьям 🙂
🤗 Новый формат публикации интересного за неделю везде встретили тепло и с обобрением, поэтому давайте поговорим о том, что интересного было замечено в предыдущую неделю!

🤕 А начнём мы в этот раз с жести: в процессорах Intel снова нашли какую-то дыру, благодаря которой возможна утечка данных: https://blogs.intel.com/technology/2020/01/ipas-intel-sa-00329/
Оповестил меня об этом DigitalOcean, сказав что они ожидают официального патча, что как бы намекает. Хотя, конечно, все пишут что ещё не было утечек через эти дырки, но как знать...

😷 Сегодня должен выйти (вышел?) Chrome 80, в котором изменили дефолтное поведение Referrer Policy. Подробнее об этом писали в "Кавычке": https://t.me/webpwn/253
Лично я всегда и везде выставляю Referrer-Policy: same-origin, чтоб партнёрки не палили откуда я на них лью трафик. Для старых браузеров это не работает, но мне хватает (вот тут описан вариант для совсем параноиков: https://www.gofuckbiz.com/showthread.php?p=1206789#post1206789)

🙌 Друже Bo0oM наконец-то вылез из окопов и опубликовал интересную статью о векторах SSRF атак: https://bo0om.ru/blind-ssrf
Я, например, не кулхацкер вовсе, но знать как защищаться от таких вещей - весьма важно и полезно, поэтому поглощаю такую информацию "на ура".

🤜 А ещё я у него подсмотрел ссылку на очень интересный репозиторий с пейлоадами, который поддерживает коммьюнити: https://github.com/swisskyrepo/PayloadsAllTheThings

💣 На zennolab форуме появилась крайне подробная статья как посниффать трафик (в том числе HTTPS) в мобильном приложении и заиметь с этого хороший профит: https://zennolab.com/discussion/threads/73304/

👨‍💻 Перейдём на (около)программерские новости: на неделе вышел PHP-дайджест №172, переписывать всё что заинтересовало нету смысла, поэтому просто оставлю ссылку и каждый сочувствующий может узнать там что-то новое для себя: https://habr.com/ru/post/485592/

🐘 В одном DevOps'овом канале запалил интересную запись о том, что в вики PostgreSQL есть примеры антипаттернов (как делать не нужно), а ещё автор нашел утилиту, которая на автомате может проверить нет ли у вашей базы таких косяков: https://t.me/overtimehate/891

🧐 Тем кто топит за высокую производительность и хайлоад на серваках с дорами - стоит обратить внимание на сравнение производительности Go, Node и Elixir: https://t.me/devopslibrary/677

🎨 С программерского перейдём на дата-саенское 🙃 На днях появился ансамбль сеток для реставрации видео (раскрашивание + повышение FPS): https://t.me/archive_404/21
Жду времён, когда матёрые дорвейщики начнут топить за создание сеток ДДЛ с результатом работы таких нейронок))) Хотя может уже и сейчас это начнётся, код то открыт 😉

🗣 На днях в DeepMind (читай: в гугле) рассказали, что смогли разработать самый лучший (по оценке людей) чат-бот: https://t.me/tldr_arxiv/57
Примечательно то, что там снова куча параметров (2.6 млрд), огромный датасет для обучения (341 ГБ) и обучалось это 30 дней на TPUv3 кластере. Но жаль, что в итоге предобученную модельку они зажопили...

📛 Дошик выложил у себя ссылку на ноутбук по генерации видео из картинки, где камера движется вглубь изображения (хер знает как называется этот эффект): https://t.me/NeuralShit/805
Выглядит классно, если обрезать лишнее. Да и вообще у него один из каналов, которые я читаю каждое утро с удовольствием) Если посмотрите - поймёте почему 🤪

💩 Самое время рассказать, что на днях утвердили стандарт Emoji 13: https://blog.emojipedia.org/117-new-emojis-in-final-list-for-2020/
Что это может для нас значить? Да ничего, просто любопытно какие ещё "смайлики" скоро появятся во всех мессенджерах.

✍️ Сеошники за эту неделю радуют годнотой, а дал старт Шакин со стратегией продвижения через краудфандинговые площадки: https://t.me/burzhunet/365
Суть в том, что некоторые проекты в обмен на пожертвование делают ссылку где-то у себя на сайте. Так почему бы не начать клепать такие сайты? 🙃

(читай далее...)