Illusion as a way to fight in the internet.

Плотников Юрий Михайлович

Private access level
Full members of NP "MOD"
Jul 21, 2010
Reaction score
Россия, Хабаровск. +7 914 544 16 90.
ROMAN, thanks, interesting stuff!
Original message
РОман, спасибо, интересный материал!

Матушкин Андрей Николаевич

Президент IAPD
Staff member
Private access level
Full members of NP "MOD"
Jan 1, 1970
Reaction score
Thanks again!
Original message
Ещё раз спасибо!


Private access level
Full members of NP "MOD"
Jun 5, 2013
Reaction score
г. Екатеринбург, Свердловская обл.
Original message

Ющук Евгений Леонидович

Private access level
Honorary Member of IAPD
Oct 23, 2013
Reaction score
Екатеринбург, тел. +7-950-641-06-09
But recently, the emphasis in promoting such systems has been on the ability to identify negative and positive. And thus giving the user a completely new unique tool. Here on this tool you need to dwell in more detail. How does he work? And also - by a set of keywords. Those. we decided that the word "pid ####" when mentioning together with the name of our product "VasKomProm" is a negative message about the product, so it will be so. Even the message "..." McWafen "is still" pid #### "because" VasKomProm "is a very decent product, but why do not they sell it?" (example real only names changed). But the mention is rather positive and this is a simple example. And then there is humor, hints, sarcasm, which machines are simply not able to understand. And here, the spacing between words and other settings will not help. How to believe such a division into negative and positive? This is a direct misinformation of the user. So do not flatter yourself at the expense of the capabilities of systems in the field of "positive-negative."

There is no misinformation here. Neither direct nor indirect. I will explain.

Firstly, far from always even one person can understand another. Yes, even look at this forum - from time to time you have to ask again what the person had in mind. In this regard, the machine identification of negative and positive is neither better nor worse than human.

Secondly, Internet resources, which are evaluated in terms of negative and positive, are divided into two unequal size categories. The first are significant, widely visited, authoritative resources. There are not many of them.
The second - "extras". In the "crowd" the opinion of each individual does not matter, but the quantity is important. When it is small, it does not affect the situation; when it becomes large, it does.

Based on this, the conclusion is obvious: the machine can look at significant resources only for the fact of mentioning the object, but not for evaluating the negative and positive. Such an assessment is already made by man.
The car can look at the "mass" also with a view to assessing the negative and positive.

How to avoid the problem of sarcasm / humor and the problem that the negative word refers to another object, which is also mentioned in the text?

In fact, there is no problem from a practical point of view.
Refined sarcasm is so rare in comparison with more direct statements that in the case of the "extras" it can be safely ignored. Most likely, he will even be balanced by the reverse statements, also not caught by the machine, as a result, the specific gravity of the negative and the positive will not change significantly. But even this fluctuation is so insignificant that it does not matter.
Negative / positive related to the object of study is caught (for example, in IQBuzz) due to the parameter "distance from the object." That is, for example, we look at the negative only in five words from the object. Naturally, some of the objects will not fall into the selection. So what? When do you assess the extent of the flood in the Far East in order to understand whether water is arriving or retreating, trying to measure it with an accuracy of a glass? It is important?


So in the case of definition systems speakers negative and positive - exactly the same.
Original message
Но последнее время упор в продвижении таких систем делается на возможности выявлять негатив и позитив. И тем самым давая в руки пользователя новый совершенно уникальный инструмент. Вот на этом то инструменте нужно остановиться подробнее. Как он работает? А также – по набору ключевых слов. Т.е. решили мы, что слово «пид####» при упоминании вместе с названием нашей продукции «ВасКомПром» это негативное сообщение про продукцию, значит так и будет. Даже сообщение «…«МакВафен» всё таки «пид####» ведь «ВасКомПром» это очень приличный продукт, но почему они его не продают?» (пример реальный изменены только названия). А ведь упоминание скорее позитивное и это простой пример. А еще есть юмор, намеки, сарказм, которые машины просто не в состоянии понять. И здесь не поможет регулировка расстояния между словами и другие настройки. Как же верить такому делению на негатив и позитив? Это уже прямое дезинформирование пользователя. Так что особо не обольщайтесь на счет возможностей систем в области «позитив-негатив».

Нет тут никакого дезинформирования пользователя. Ни прямого, ни косвенного. Поясню.

Во-первых, далеко не всегда даже один человек может понять другого. Да хоть на этот форум посмотрите - время от времени приходится переспрашивать, что имел в виду человек. В этом плане, машинное выявление негатива и позитива не лучше и не хуже человеческого.

Во-вторых, интернет-ресурсы, которые оцениваются с точки зрения негатива и позитива, делятся на две неодинаковых по размеру категории. Первые - это значимые, широко посещаемые, авторитетные ресурсы. Их не много.
Вторые - "массовка". В "массовке" мнение каждого отдельного человека значения не имеет, но важно именно количество. Когда оно небольшое- это никак не влияет на ситуацию, когда оно становится большим - влияет.

Исходя из этого, очевиден и вывод: значимые ресурсы машина может отсматривать только на предмет факта упоминания объекта, но не оценки негатива и позитива. Такую оценку производит уже человек.
"Массовку" машина может отсматривать и на предмет оценки негатива и позитива.

Как при этом избегать проблемы сарказма/юмора и проблемы, что негативное слово относится к другому объекту, который также упомянут в тексте?

На самом деле, нет тут никакой проблемы, с практической точки зрения.
Сарказм встречается в рафинированном виде настолько редко, по сравнению с более прямыми высказываниями, что в случае "массовки" его можно спокойно проигнорировать. Он, скорее всего, даже уравновесится обратными высказываниями, также не отлавливаемыми машиной, в результате удельный вес негатива и позитива значимым образом не изменится. Но и эта флюктуация настолько незначительна, что значения не имеет.
Негатив/позитив, относящийся к объекту изучения, отлавливается (например, в IQBuzz) за счет параметра "расстояние от объекта". Т.е., например, смотрим негатив только в пяти словах от объекта. Естественно, часть объектов не попадет в выборку. Ну и что? Вы когда масштабы паводка на Дальнем Востоке оцениваете, чтобы понять, прибывает вода или отступает, пытаетесь с точностью до стакана его измерять? Это важно?


Вот и в случае с системами определения динамики негатива и позитива - точно так же.