Contact us in messengers or by phone.

whatsapp telegram viber phone email
+79214188555

Opportunities and limitations of automatic detection of negative

Ющук Евгений Леонидович

Private access level
Honorary Member of IAPD
Joined
Oct 23, 2013
Messages
522
Reaction score
2
Points
18
Location
Екатеринбург, тел. +7-950-641-06-09
Website
ci-razvedka.ru
Opportunities and limitations of automatic detection of negative and positive

Source

Around the issues of automating the identification of negative and positive in texts, with the current level of development of monitoring systems, disputes often arise. Critics of such systems have two main arguments. The first is that the machine cannot distinguish between sarcasm and humor, and the second is that if there are two objects in the text (for example, when comparing the Mercedes type, it’s guano, and this is known to every normal person, but “Lada Kalina” is rulezizz ") - the machine will not understand to whom it belongs.

I will express my opinion on this issue.

Automata really are in many ways inferior to humans when it comes to understanding emotions. But they are significantly superior to humans in speed. Therefore, for practical purposes, it is much more important to make a million page coverage than to carefully analyze a dozen. And this, in practice, does not lead to problems, with the modern development of systems for determining positive and negative. I will explain why.

Firstly, far from always even one person can understand another. Yes, at least look at any Internet forum - from time to time you have to ask again what people had in mind. In this regard, the machine identification of negative and positive is neither better nor worse than human.

Secondly, Internet resources, which are evaluated in terms of negative and positive, are divided into two unequal size categories. The first are significant, widely visited, authoritative resources. There are not many of them.
The second - "extras". In the "crowd" the opinion of each individual does not matter, but the quantity is important. When it is small, it does not affect the situation; when it becomes large, it does.

Based on this, the conclusion is obvious: the machine can look at significant resources only for the fact of mentioning the object, but not for evaluating the negative and positive. Such an assessment is already made by man.
The car can look at the "mass" also with a view to assessing the negative and positive.

How to avoid the problem of sarcasm / humor and the problem that the negative word refers to another object, which is also mentioned in the text?

In fact, there is no problem from a practical point of view.
Refined sarcasm is so rare in comparison with more direct statements that in the case of the "extras" it can be safely ignored. Most likely, he will even be balanced by the reverse statements, also not caught by the machine, as a result, the specific gravity of the negative and the positive will not change significantly. But even this fluctuation is so insignificant that it does not matter.
Negative / positive related to the object of study is caught (for example, in IQBuzz) due to the parameter "distance from the object." That is, for example, we look at the negative only in five words from the object. Naturally, some of the objects will not fall into the selection. So what? When do you assess the extent of the flood in the Far East in order to understand whether water is arriving or retreating, trying to measure it with an accuracy of a glass? It is important?

razliv_amura.jpg


So in the case of definition systems speakers negative and positive - exactly the same.
 
Original message
Возможности и ограничения автоматического выявления негатива и позитива

Источник

Вокруг вопросов автоматизации выявления негатива и позитива в текстах при современном уровне развития систем мониторинга споры возникают часто. У критиков таких систем есть два основных аргумента. Первый - что автомат не может различить сарказм и юмор, а второй - что если в тексте есть два объекта (например, при сравнении типа "Мерседес" - гуано, и это известно каждому нормальному человеку, а вот "Лада Калина" - рулёззз") - автомат не поймет, к кому что относится.

Выскажу свое мнение по этому вопросу.

Автоматы действительно во многом уступают человеку, когда речь идет о понимании эмоций. Но они значительно превосходят человека в скорости работы. Поэтому, для практических целей бывает значительно важнее сделать охват в миллион страниц, нежели тщательно проанализировать десяток. И это, на практике, не приводит к проблемам, при современном развитии систем определения позитива и негатива. Поясню, почему.

Во-первых, далеко не всегда даже один человек может понять другого. Да хоть на любой Интернет-форум посмотрите - время от времени приходится переспрашивать, что имел в виду человек. В этом плане, машинное выявление негатива и позитива не лучше и не хуже человеческого.

Во-вторых, интернет-ресурсы, которые оцениваются с точки зрения негатива и позитива, делятся на две неодинаковых по размеру категории. Первые - это значимые, широко посещаемые, авторитетные ресурсы. Их не много.
Вторые - "массовка". В "массовке" мнение каждого отдельного человека значения не имеет, но важно именно количество. Когда оно небольшое- это никак не влияет на ситуацию, когда оно становится большим - влияет.

Исходя из этого, очевиден и вывод: значимые ресурсы машина может отсматривать только на предмет факта упоминания объекта, но не оценки негатива и позитива. Такую оценку производит уже человек.
"Массовку" машина может отсматривать и на предмет оценки негатива и позитива.

Как при этом избегать проблемы сарказма/юмора и проблемы, что негативное слово относится к другому объекту, который также упомянут в тексте?

На самом деле, нет тут никакой проблемы, с практической точки зрения.
Сарказм встречается в рафинированном виде настолько редко, по сравнению с более прямыми высказываниями, что в случае "массовки" его можно спокойно проигнорировать. Он, скорее всего, даже уравновесится обратными высказываниями, также не отлавливаемыми машиной, в результате удельный вес негатива и позитива значимым образом не изменится. Но и эта флюктуация настолько незначительна, что значения не имеет.
Негатив/позитив, относящийся к объекту изучения, отлавливается (например, в IQBuzz) за счет параметра "расстояние от объекта". Т.е., например, смотрим негатив только в пяти словах от объекта. Естественно, часть объектов не попадет в выборку. Ну и что? Вы когда масштабы паводка на Дальнем Востоке оцениваете, чтобы понять, прибывает вода или отступает, пытаетесь с точностью до стакана его измерять? Это важно?

razliv_amura.jpg


Вот и в случае с системами определения динамики негатива и позитива - точно так же.

Группа К

Private access level
Joined
Aug 19, 2012
Messages
387
Reaction score
124
Points
43
Location
Н.Ополчения, 34с1 Город-герой Москва 123423 Россия
Website
www.krioni.com
How to avoid the problem of sarcasm / humor and the problem that the negative word refers to another object, which is also mentioned in the text?

The solution to the problem of choosing between sarcasm / humor or yes / no was described in detail in the work THE ROLE OF SOFT CALCULATIONS AND FUZZY LOGIC IN UNDERSTANDING, DESIGNING AND DEVELOPING INFORMATION / INTELLECTUAL SYSTEMS academician LA Zade.

In this and his other works, Academician Zade suggested using a projection from qualitative to quantitative characteristics. For example, if we talk about flooding, then the task is described by words in the form of fuzzy if-then-rules:
- If the flood is small, then the value is small,
- If the flood seems to be average, then the quantitative value is average,
- If the flood seems to the researcher to be large, then its quantitative indicator is greater than the previous value,
Here, the values “small”, “medium” and “large” are defined using their membership functions. These functions or quantitative values are determined by the researcher based on his experience.

By the way

Negative / positive related to the object of study is caught (for example, in IQBuzz) due to the parameter "distance from the object." That is, for example, we look at the negative only in five words from the object.

You have given a very successful example of projecting a qualitative characteristic of an event into its quantitative value - one out of five. Look at your palm. Five fingers have always served the rational person, not only as a convenient tool for performing labor functions, but also as a way to express their attitude to any event. For example, opening a palm and showing all five fingers to the interlocutor, we kind of say - Super. Fluctuations of the index finger left and right speaks more about a negative assessment of what is happening. Thus, figure 5 is a universal quantitative measure of events, including floods in the Far East).

If the flood is small, then 1,
If the flood seems less than average, then 2,
If the flood is medium, then 3
If the flood is greater than average, then 4 points
If the flood is large, then 5 points

It was LA Zade's theory that was used in the Search Audit program. There are 67 factors, each of which describes its own "flood". For example. Upon inspection of the office, the detective discovered that the office plate was missing. Based on a subjective assessment of this "flood scale", the detective evaluates this event by moving the indicator to one of five positions. The program contains values for each of the five provisions. Based on 67 factors, the internal algorithm program calculates the final company business reliability index.

Like this. By the way, until January 10, the program is offered for free
 
Original message
Как при этом избегать проблемы сарказма/юмора и проблемы, что негативное слово относится к другому объекту, который также упомянут в тексте?

Решение проблемы выбора между сарказмом/юмором или да/нет подробно изложил работе РОЛЬ МЯГКИХ ВЫЧИСЛЕНИЙ И НЕЧЕТКОЙ ЛОГИКИ В ПОНИМАНИИ, КОНСТРУИРОВАНИИ И РАЗВИТИИ ИНФОРМАЦИОННЫХ / ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ академик ЛА Заде.

В этой и других своих работах академик Заде предложил использовать проекцию с качественных характеристик в количественные. К примеру, если говорить о наводнении то задача описывается словами в виде нечетких «если-то»-правил:
- Если наводнение малое, то значение малое,
- Если наводнение кажется средним, то и количественное значение среднее,
- Если наводнение представляется исследователю большим, то и его количественный показатель больше чем предыдущее значение,
Здесь значения «малое», «среднее» и «большое» определены с помощью их функций принадлежности. Данные функции или количественные значения определяет сам исследователь исходя из его опыта.

Кстати,

Негатив/позитив, относящийся к объекту изучения, отлавливается (например, в IQBuzz) за счет параметра "расстояние от объекта". Т.е., например, смотрим негатив только в пяти словах от объекта.

Вы привели очень удачный пример проекции качественной характеристики события в ее количественное значение - один из пяти. Посмотрите на свою ладонь. Пять пальцев всегда служили человеку разумному не только как удобный инструмент для выполнения трудовых функций, но и как способ выразить свое отношение к какому-либо событию. Например раскрывая ладонь и показывая все пять пальцев собеседнику мы как бы говорим - Супер. Колебания указательным пальцем влево-вправо говорит скорее об отрицательной оценке происходящего. Таким образом цифра 5 является универсальным количественным измерителем события, в том числе и наводнения на ДВ).

Если наводнение малое, то 1,
Если наводнение кажется меньше среднего, то 2,
Если наводнение среднее, то 3
Если наводнение больше среднего , то 4 балла
Если наводнение большое, то 5 баллов

Именно теорию Л А Заде использована в программе Сыскной Аудит. Здесь 67 факторов, каждый из которых описывает своё "наводнение". Например. При осмотре офиса детектив обнаружил, что офисная табличка отсутствует. Исходя из субъективной оценки этого "масштаба паводка" детектив оценивает данное событие передвигая индикатор в одно из пяти положений. В программе заложены значения для каждого из пяти положений. Пройдя по 67 факторам программа по внутреннему алгоритму делает расчет итогового индекса деловой надежности компании.

Вот так. Кстати до 10 января программа предлагается бесплатно

Ющук Евгений Леонидович

Private access level
Honorary Member of IAPD
Joined
Oct 23, 2013
Messages
522
Reaction score
2
Points
18
Location
Екатеринбург, тел. +7-950-641-06-09
Website
ci-razvedka.ru
Y644232, thanks!
 
Original message
Y644232, спасибо!

Ющук Евгений Леонидович

Private access level
Honorary Member of IAPD
Joined
Oct 23, 2013
Messages
522
Reaction score
2
Points
18
Location
Екатеринбург, тел. +7-950-641-06-09
Website
ci-razvedka.ru
Y644232 said:
By the way, until January 10, the program is offered for free
Thanks again. And where can I get it for review?
 
Original message
Y644232 said:
Кстати до 10 января программа предлагается бесплатно
И еще раз спасибо. А где можно ее взять для ознакомления?

Группа К

Private access level
Joined
Aug 19, 2012
Messages
387
Reaction score
124
Points
43
Location
Н.Ополчения, 34с1 Город-герой Москва 123423 Россия
Website
www.krioni.com
Ющук Евгений Леонидович said:
Y644232 said:
By the way, until January 10, the program is offered for free
Thanks again. And where can I get it for review?


Detective audit program can be downloaded here
[DLMURL] https://itunes.apple.com/en/app/detecti [/ DLMURL] ...? L = en & mt = 8
The program can be launched on iPhones 4 and 5.

Download is free. If there is interest, then the freebie can be extended)))) Information request to the Federal State Statistics Service of Rosstat paid - 300 rubles. For this money, the user receives all reg information about the company. But that's not all. In addition to the program, it automatically calculates risks for 12 factors.
I would be glad if you leave your review, it does not matter positive or not)

thank
respectfully
Krioni Alexander
 
Original message
Ющук Евгений Леонидович said:
Y644232 said:
Кстати до 10 января программа предлагается бесплатно
И еще раз спасибо. А где можно ее взять для ознакомления?


Программу сыскной аудит можно скачать здесь
[DLMURL]https://itunes.apple.com/ru/app/detecti[/DLMURL] ... ?l=en&mt=8
Программу можно запустить на айфонах 4 и 5.

Скачать можно бесплатно. Если будет интерес, то халяву можно будет продлить)))) Запрос информации в ГМЦ Росстата платный - 300 рублей. За эти деньги пользователь получает всю рег информацию о компании. Но это не все. В дополнение к программа автоматом подсчитывает риски по 12 факторам.
Буду рад если оставите свой отзыв, не важно положительный или не очень)

Спасибо
С уважением
Криони Александр
Last edited by a moderator:

Ющук Евгений Леонидович

Private access level
Honorary Member of IAPD
Joined
Oct 23, 2013
Messages
522
Reaction score
2
Points
18
Location
Екатеринбург, тел. +7-950-641-06-09
Website
ci-razvedka.ru
Thank you, Alexander! I will take a look and contact you. Or in the end, or in the process - if questions arise.
 
Original message
Спасибо, Александр! Я посмотрю и свяжусь с Вами. Или по итогу, или в процессе - если вопросы появятся.

Группа К

Private access level
Joined
Aug 19, 2012
Messages
387
Reaction score
124
Points
43
Location
Н.Ополчения, 34с1 Город-герой Москва 123423 Россия
Website
www.krioni.com
Ющук Евгений Леонидович said:
Thank you, Alexander! I will take a look and contact you. Or in the end, or in the process - if questions arise.

Always well!
 
Original message
Ющук Евгений Леонидович said:
Спасибо, Александр! Я посмотрю и свяжусь с Вами. Или по итогу, или в процессе - если вопросы появятся.

Всегда велком!

Ющук Евгений Леонидович

Private access level
Honorary Member of IAPD
Joined
Oct 23, 2013
Messages
522
Reaction score
2
Points
18
Location
Екатеринбург, тел. +7-950-641-06-09
Website
ci-razvedka.ru
Did I understand correctly that the application in EppStor is the only version of the program? Does it not exist for Windows or Linux?
 
Original message
Я правильно понял, что приложение в ЭппСтор - единственная версия программы? Для Windows или Linux ее не существует?

Группа К

Private access level
Joined
Aug 19, 2012
Messages
387
Reaction score
124
Points
43
Location
Н.Ополчения, 34с1 Город-герой Москва 123423 Россия
Website
www.krioni.com
Ющук Евгений Леонидович said:
Did I understand correctly that the application in EppStor is the only version of the program? Does it not exist for Windows or Linux?

No Eugene, so far only for the Appstore
 
Original message
Ющук Евгений Леонидович said:
Я правильно понял, что приложение в ЭппСтор - единственная версия программы? Для Windows или Linux ее не существует?

Нет Евгений, пока только для Appstore

Ющук Евгений Леонидович

Private access level
Honorary Member of IAPD
Joined
Oct 23, 2013
Messages
522
Reaction score
2
Points
18
Location
Екатеринбург, тел. +7-950-641-06-09
Website
ci-razvedka.ru
Yeah, okay. Well, then I'll look at Apple products.
 
Original message
Ага, понятно. Ну, значит, посмотрю на эппловской продукции.