Где брать тексты для сайта?

Руслан аватар
3

Я беру их в торентах например torrents(точкару), там народ выкладывает разные отсканорованные книги по тематике. Я их прогоняю через FineReader он переводит всё в текст.
Идея может не нова но вдруг кому пригодится, я таким образом закачал много текста, предварительно конечно удостоверился что нигде его нет. Но вот странно, недели через две три ЭТОТ ЖЕ ТЕКСТ появился на других сайтах.
Бывает, что трудно найти не использованный текст, тогда помогают книги прошлого от 1920 и ниже.

Jameson аватар
73

"Руслан" писал(а):
Но вот странно, недели через две три ЭТОТ ЖЕ ТЕКСТ появился на других сайтах
Вы серьезно? Не догадываетесь, почему?
"Руслан" писал(а):
помогают книги прошлого от 1920 и ниже
Ничего себе, в библиотеках приходится работать, наверное? Там соглашаются такие старые книжки сканировать? ))

Руслан аватар
3

Jameson Я так понимаю по Вашему тону Вы не очень то дружелюбный субъект, но я пришёл не издеваться как Вы, а дать идею.
1
Догадываюсь, рано или поздно парвоначальный текст растекается, но как ты думаешь кому отдаст поисковик предпочтение? Правильно, первому установившему этот текст.
2
Я же говорю, в торрентах есть всё, недавно скачал русская вышивка 1840.pdf, Описание старинных русских утварей, одежд, оружия... 1896.pdf, узоры старинной вышивки 1850.pdf, корсет 1864.pdf и т.д.
И не надо самому ничего сканировать в библиотеках, Вы что?

Snob аватар
320

"Руслан" писал(а):
Я беру их в торентах например torrents(точкару), там народ выкладывает разные отсканорованные книги по тематике. Я их прогоняю через FineReader он переводит всё в текст.
Идея может не нова но вдруг кому пригодится, я таким образом закачал много текста, предварительно конечно удостоверился что нигде его нет. Но вот странно, недели через две три ЭТОТ ЖЕ ТЕКСТ появился на других сайтах.
Бывает, что трудно найти не использованный текст, тогда помогают книги прошлого от 1920 и ниже.

По-моему Вы занимаетесь ерундой.
Объясню почему.

Время на распознавание и правку - большое + возможность получить абузу от правообладателей книги.
Уж если воровать контент, то в промышленных масштабах и не привязываться к своим физическим возможностям (правка, скан и т.п.).

Руслан аватар
3

"Snob" писал(а):
Время на распознавание и правку - большое + возможность получить абузу от правообладателей книги.
Уж если воровать контент, то в промышленных масштабах и не привязываться к своим физическим возможностям (правка, скан и т.п.).

Время на распознавание текста 100 страниц 5-10 минут, правка страницы минута.
Правообладатели умерли 100 лет назад. Но автора всё равно указываю, а не приписываю себе вот пример

Snob аватар
320

"Руслан" писал(а):
Время на распознавание текста 100 страниц 5-10 минут, правка страницы минута.
Правообладатели умерли 100 лет назад. Но автора всё равно указываю, а не приписываю себе вот пример

Умерли авторы, а не правообладатели.

Распознавание:
100 стр = 5-10 минут
1000 стр = 50-100 минут

Правка:
1 стр = 1 мин.
1000 стр = 1000 мин.

Итого: 1000 + 100 = 1100 мин. или >18 часов

И Хде тут деньги?

Руслан аватар
3

"Snob" писал(а):
Распознавание:
100 стр = 5-10 минут
1000 стр = 50-100 минут

Правка:
1 стр = 1 мин.
1000 стр = 1000 мин.

Итого: 1000 + 100 = 1100 мин. или >18 часов

И Хде тут деньги?

1000 страниц?
Это где такое ты видел? Ты бы ещё привёл пример с миллионом страниц ))))

Snob аватар
320

"Руслан" писал(а):
1000 страниц?
Это где такое ты видел? Ты бы ещё привёл пример с миллионом страниц ))))

Поэтому я и сказал, что Вы ерундой занимаетесь.
Где видел? хм. Каждый день на своих ГС наблюдаю.

Руслан аватар
3

"Snob" писал(а):
Поэтому я и сказал, что Вы ерундой занимаетесь.
Где видел? хм. Каждый день на своих ГС наблюдаю.

А мне за материал спасибо говорят, ведь это не просто тексты а полезная информация. Много народа заходит почитать, скачать, ведь это ценная информация по теме сайта которой очень мало в интернете. Так почему же ерунда?
А по 1000 страниц каждый день где то в КС, мне даже трудно представить что это за мусор....

magzimus аватар
11

Пару раз, просто искал реферат по теме и качал, очень часто текст ещё нигде не использовался. Но так, разумеется, далеко не уедешь...

Snob аватар
320

"magzimus" писал(а):
А мне за материал спасибо говорят, ведь это не просто тексты а полезная информация. Много народа заходит почитать, скачать, ведь это ценная информация по теме сайта которой очень мало в интернете. Так почему же ерунда?

А, ну если цель - быть полезным обществу, а не заработать бабок, то тогда ладно.
Я как-то про меценатство запамятовал.

"magzimus" писал(а):
Но так, разумеется, далеко не уедешь...

Золотые слова.

Руслан аватар
3

"Snob" писал(а):
А, ну если цель - быть полезным обществу, а не заработать бабок, то тогда ладно.
Я как-то про меценатство запамятовал.

Есть сайт, совершенно дурацкого дизайна, если в яндексе набрать тамада юлия он будет на первом месте. Там много полезной информации. Заходят чтоб почитать по 2000 человек в день. Говорят спасибо. Делай выводы...

Snob аватар
320

"Руслан" писал(а):
Там много полезной информации. Заходят чтоб почитать по 2000 человек в день. Говорят спасибо. Делай выводы...

Есть сайт, совершенно дурацкого дизайна и если набрать кое какие ключи, он будет на первых местах. Там нет полезной информации, контент сгенерирован. Заходят на сайт по 3000-5000 человек в день, а потом направляются куда нужно, где они отправляют смски. Говорю им спасибо! Делай выводы =).

Elena аватар
4

Я пишу статьи сама. Но вот дилема: написАла 10 статей по теме моих ресов.
Размножила через генератор. Получается 100 ГС. Куда их можно пристроить? Кроме таких-же Гкаталогов или ГС?
С уникумом проблем нет - практически все, кому я предлагаю соглашаются на размещение. А с этими ГС не знаю.. где их регистрировать, как-то даже стыдно.
Как и где правильно разместить сгенерированные статьи?

Руслан аватар
3

"Snob" писал(а):
Есть сайт, совершенно дурацкого дизайна и если набрать кое какие ключи, он будет на первых местах. Там нет полезной информации, контент сгенерирован. Заходят на сайт по 3000-5000 человек в день, а потом направляются куда нужно, где они отправляют смски. Говорю им спасибо! Делай выводы =).

Билибирда какая то.

Snob аватар
320

"Руслан" писал(а):
Билибирда какая то.

Вам стоит задуматься на счёт разницы между хобби и бизнесом =).

Руслан аватар
3

А бизнес не может быть хобби? Если у Вас так, я Вам сочувствую. Я люблю свою работу и не делаю ничего мусорного.

Elena аватар
4

А мне ктонить ответит? Или я не в той теме общаюсь?
У вас тут дебаты, я смотрю. Я честно,понятия не имею
- куда сгенерированные статьи пристраивать..
В каталоги - не хочу. Они всё равно со временем будут забанены.
Куда?

Руслан аватар
3

Елена
Прошу прощения, но я даже не знаю что такое ГС.
Если пишешь грамотно статьи, куплю у тебя на тему "Женская одежда больших размеров" или "раздвижные двери". Вопрос в цене, сколько будет стоить ну примерно лист А4?

Snob аватар
320

"Руслан" писал(а):
А бизнес не может быть хобби? Если у Вас так, я Вам сочувствую. Я люблю свою работу и не делаю ничего мусорного.

Бизнес может быть хобби. Но, как и в любом бизнесе, бабло превыше всего. Если Вы ставите в первую очередь "полезность", а не деньги, значит это хобби, меценатство.

"Elena" писал(а):
Получается 100 ГС

Не стоит использовать одно и тоже сокращение, для обозначения разных вещей. ГС - это говносайт и ничего более.
по теме, если Вы на выходе получаете плохое качество статей, значит плохо синонимизируете. Профессионалы делают из 1 текста 100 штук такого качества, что хер подкопаешься.

"Elena" писал(а):
Я честно,понятия не имею
- куда сгенерированные статьи пристраивать..

liex

"Руслан" писал(а):
Вопрос в цене, сколько будет стоить ну примерно лист А4?

оплата за тексты производится обычно из расчёта за 1000 знаков, а не 1 лист А4.

Руслан аватар
3

Ну 1000 знаков я не могу представить. а А4 в шрифте 8-9 вполне.

А КАК НАЗЫВАЕТСЯ ТОТ ГЕНЕРАТОР КОТОРЫЙ СИНОНИМИЗИРУЕТ?

Snob аватар
320

"Руслан" писал(а):
Ну 1000 знаков я не могу представить. а А4 в шрифте 8-9 вполне.

Вы юморист =).

"Руслан" писал(а):
А КАК НАЗЫВАЕТСЯ ТОТ ГЕНЕРАТОР КОТОРЫЙ СИНОНИМИЗИРУЕТ?

Мне кажется печатать предложения в capslock не очень красиво.
Синонимайзер

Robotti аватар
83

"Руслан" писал(а):
Ну 1000 знаков я не могу представить. а А4 в шрифте 8-9 вполне.

поисковик - наоборот

Руслан аватар
3

"Snob" писал(а):
Мне кажется печатать предложения в capslock не очень красиво.

Случайно нажалась
"Snob" писал(а):
Вы юморист =).

По моему так удобней, как считать же их 1000 знаков? а если 10000 знаков, замучаешься...

Snob аватар
320

"Руслан" писал(а):
По моему так удобней, как считать же их 1000 знаков? а если 10000 знаков, замучаешься...

Пиздец граждане. Пишите ещё, давно так не смеялся =).
Открою Вам маленький секрет:

Elena аватар
4

Славненько так я здесь посмеялась - респект обоим!
По поводу генераторов, так называемых "уникальных" статей, да, Сноб - Вы правы. Тут опыт нужен. liex и миралинкс - там и буду размещать - спасибо.
А насчёт глупых вопросов... я в сео три мес всего, так вот, пару мес назад спросила у Платона: тИЦ/3 бывает? Вежливо так ответили: нЕ бЫвАеТ..
===
Руслану: про женскую одежду боооольших размеров не пишу. Тема моих сайтов - сайтостроительство,работа в Рунете, мебель и дизайн интерьеров.

Руслан аватар
3

Теперь я понимаю что такое ГС. Это прискорбно.
Каждую неделю появляются новые программные «разработки» по созданию и управлению г-сайтами. И никого не волнует что сайты на CMS типа 2плюса или цсмсимпл фильтруются на этапе индексации, подобная судьба ожидает другие схожие системы.
Особенно впечатляет софт, в промышленном масштабе ворующий контент с популярных сайтов.
Один из самых простых и удобных движков – WordPress по сути дискредитирован огромным количеством сплогов и MFS-сайтов.

«Непот», «ты последний«, массовые баны, фильтрация поисковых сегментов..
Что будет дальше? Время покажет. Но эпоха бездумного манимейкерства подходит к концу и в первую очередь пострадают те, кто делает ставку на сиюминутный результат.
Чем больше таких людей как Сноб тем более и более засран интернет их ГС следует ГП- ГИ-ГМ т.е. говносайт говнопоисковик говноинтернет говномир.
Это всё равно что идти к помойке выбрасывать мусор, но не дойдя до него разбрасать по улице или из окна выбрасывать мусор, вроде смотришь на небо и не замечаешь что внизу скопилась гора смердящего гавна. Это и называется Быдлость.

Я же предлагаю другое. Наполнять сайт нормальным контентом, которого ещё нет в инэте, который будет нужен и интересен людям. Поэтому мой аватар всегда солнце.

Robotti аватар
83

Руслан, Вы идеалист.

"Руслан" писал(а):
Я же предлагаю другое. Наполнять сайт нормальным контентом, которого ещё нет в инэте, который будет нужен и интересен людям.

Никто ведь не мешает, наполняйте... у каждого свои взгляды на создание сайтов... кто-то может сидеть часами сочинять хорошие статьи и размещать их у себя на сайте, а кто-то за это время напишет несколько скриптов, которые полностью передерут несколько сайтов... кто при этом выйграет в итоге - время покажет.

PS не пойму почему это все Вас так зацепило...

Руслан аватар
3

"Robotti" писал(а):
за это время напишет несколько скриптов, которые полностью передерут несколько сайтов... кто при этом выйграет в итоге - время покажет.

PS не пойму почему это все Вас так зацепило...

Не понимаете? Странно!

Иногда очень хочется найти полезную информацию в интернете, но постоянно натыкаюсь на эти ГС, я раньше думал что за быдло их создаёт, теперь всё ясно.
И при чём, уже не важен в продвижении дизайн сайта, это оказывается муть.
Вот создал я для себя http://www.svarga.su/ На мой вопрос лично к Роме Воронежскому, а почему мой сайт у вас в яндексе не индексируется? прозвучал ответ: напихай на главную контента с мешок...Я В ШОКЕ! Куда идём?

Snob аватар
320

"Руслан" писал(а):
Теперь я понимаю что такое ГС. Это прискорбно.

Я рад, что Вы хоть что-то подчерпнули по результатам нашего диалога =).

"Руслан" писал(а):
. И никого не волнует что сайты на CMS типа 2плюса или цсмсимпл фильтруются на этапе индексации, подобная судьба ожидает другие схожие системы.

Бред. Считаю, что никакого бана или фильтра по движку не существует. Просто есть масса схожих признаков у ГС и всё тут. Что касается автоматических фильтров, то включим мозг, можно путём несложных манипуляций обойти всё это.

"Руслан" писал(а):
Один из самых простых и удобных движков – WordPress по сути дискредитирован огромным количеством сплогов и MFS-сайтов.

Никто ничего не дискредитировал, успокойтесь. WP просто один из самых распространённых движков и всё тут.

"Руслан" писал(а):
Но эпоха бездумного манимейкерства подходит к концу и в первую очередь пострадают те, кто делает ставку на сиюминутный результат.

Не знаю, обрадует Вас это или нет, но эпоха бездумного манимейкерства уже давно прошла, лет этах 10 назад.
На сегодняшний день, с технической и интеллектуальной точки зрения, профессиональные дорвейщики и специалисты по ГС переплюнут любого "белого", а уровень понимания принципов работы ПС находится на высоте.

"Руслан" писал(а):
Чем больше таких людей как Сноб тем более и более засран интернет их ГС следует ГП- ГИ-ГМ т.е. говносайт говнопоисковик говноинтернет говномир.

Задумайтесь как нибудь над тем, что в борьбе с ГС и дорами, ПС улучшают и совершенствуют свои алгоритмы. Простой пример: в беге, если человек бежит один, он даёт более плохие результаты, нежели когда он с кем-то соревнуется.

"Руслан" писал(а):
Это всё равно что идти к помойке выбрасывать мусор, но не дойдя до него разбрасать по улице или из окна выбрасывать мусор, вроде смотришь на небо и не замечаешь что внизу скопилась гора смердящего гавна. Это и называется Быдлость.

С ассоциативным рядом у Вас хреновато.

"Руслан" писал(а):
Я же предлагаю другое. Наполнять сайт нормальным контентом, которого ещё нет в инэте, который будет нужен и интересен людям.

Если воспользоваться Вашим термином "быдлость", то разве не так можно назвать факт кражи у правообладателей контента. Чем Вы собственно и занимаетесь, когда сканируете книги. В такой ситуации, Вы - вор. Вы крадёте информацию, которая Вам не принадлежит. Я по крайней мере не пытаюсь подменивать понятия и говорю открыто. А Вы разводите демагогию.

"Руслан" писал(а):
я раньше думал что за быдло их создаёт, теперь всё ясно

Именно такая же мысль приходит в голову правообладателям книг, которые Вы так любезно решили предоставить людям во всеобщее пользование.

Руслан аватар
3

ясно, круто!!!