>Никнейм автора комментария: sparinov
>Первые ответные комментарии:
-----------------------
Мне понравилось, что Вы не приуныли, а сразу стали искать решение. Думаю, посетители Элементов могут тоже кое-что подсказать Вам из своего опыта. Вы правы, часть этих проблем, действительно, можно решить доступными средствами (в частности, имея хороших программистов). Уточню кое-что:
1) Проблема приоритета. Если Ваш ресурс берет на себя решение этой проблемы, то, прежде всего, необходимо ОБЪЯВИТЬ об этом на весь мир :-) и расписать, в чем это будет заключаться . Др. сл., снять у ученых страх, что они могут стать жертвой плагиата. На e-print-arXiv объявлено, что приоритетом служит дата поступления статьи, которая ничем изменена быть не может; причем только в течении первой недели (если не забыл) можно делать исправления в статье; а затем предлагается поместить исправленную статью заново, чтобы у ней приоритет начался с новой даты.
2) Спам там отсеивается «вручную»: сидят добровольные модераторы и просматривают статьи. Как я понимаю, просматривают названия статей, affiliation, абстракт и первые одну две страницы. Если употребляются привычные в современной литературе формулы, если человек из известного вуза или научного учреждения, и т.д., то принимается. Если подозрительно, отсекается. Не знаю, можно ли автоматизировать такой отбор. Скажем, можно задать машине отмечать все слова из порнословаря и автоматически отбрасывать такую работу. Но в остальном возникают трудности. Например, слово «эфир» в современной физике «ругательное» :-). Но ведь ученый может критиковать эфир, и это слово будет там присутствовать «по закону». Программа не сможет решить, пригодна ли эта работа для архива или нет; только человек. Правда, «Open Source» по Вашей идее должен принимать все статьи. Тогда этой проблемы не возникает, но возникает другая, более серьезная (о которой позже).
3) Сканирование плагиатов – очень интересная идея.. Вы должны написать правила сравнения текстов, просканировать все научные тексты интернета, выявить их авторов и поместить их на Доску Позора :-) . Наверно, это сделать можно, хотя нужна сложная программа. Ну, а если украли и поместили в бумажный журнал, который не имеет Open Access?
Впрочем, проблема плагиата не решена достаточно и на e-print-arXiv
4) Конечно, можно иметь в распоряжении «личный» робот, которому можно дать задание рассылать свои статьи по некоторым адресам. Но, во-первых, надо получить разрешение этих людей на посылку им статей, иначе все начнут рассылать всем всё, что угодно. А, во-вторых, таким способом можно разослать статьи только своим коллегам (они, вероятно, согласятся), а другим, особенно высокопоставленным ученым - вряд ли это возможно.
Но есть проблемы, которые программными средствами не решить. Вы слышали, конечно, о борьбе со лженаукой. Вот Российской Академии Наук больше нечем заниматься, как только бороться со лженаукой! Представьте себе, они даже создали для этого комиссию. Журнал ТрВ
http://elementy.ru/blogs/users/zombye/38853/#comments
(кажется, от ФИАН) тоже подключился к этому. Если ваш ресурс действительно будет Open Source и Вы действительно будете следовать закону о свободе слова, то у Вас возникнут проблемы с РАН, ФИАН и др. подобными учреждениями. Значит, или на Вашем ресурсе будет свобода слова, или он будет не признан этими учреждениями, со всеми вытекающими из этого последствиями.
Что это значит? На него не будут заходить никто из сотрудников этих учреждений и им подчиненным. А значит, никто из профессиональных ученых. Таким образом, со свободой слова придется распрощаться.
Вам придется учредить серьезный надзор, а попросту, цензуру. Выделить «порнослова» лженауки, по которым программа будет исключать статьи. Например то же слово «эфир». Ссылки не всех, кто утверждал, что эфир существует (Ньютон, Декарт, Фарадей, Максвелл, Гельмгольц, Лорд Кельвин, Дж. Дж. Томсон, Лорентц, Лармор и еще сотни всех их современников-ученых, академиков, нобелевских лауреатов) должны тщательно проверяться :-). И т.д., и т.п.
Я не так давно встретил статью, которая посвящена анализу понятий науки и лженауки:
http://www.emigrin.narod.ru/pseudoscience_www/contents.htm
на котором упоминается, о желании установить правила, по которым можно автоматически отделять ученых от лжеученых. Автор не смог этого сделать.