что такое kad ratio

Что такое KDA и как считается KDA ratio в Dota 2

KDA (Kills-Deaths-Assists) — счёт героя в игре. Первое число соответствует количеству убитых героев, второе — смертей, третье — количество ассистов (помощей) в убийстве вражеских героев. Хорошим КДА принято считать большое количество убийств и ассистов при малом количестве (в идеале — полном отсутствии) смертей.

KDA ratio — число, отражающее внесённый вклад героем в игру в виде соотношения между сумой убийств и ассистов разделённое на количество смертей. Хорошим KDA ratio считают показатель выше двух (вы убиваете или зарабатываете ассист на один раз больше, чем умираете).

Данная статистика гораздо лучше описывает полезность героя в игре и его вклад в неё, чем просто счётчик убийств-смертей (считается, что герой со счётом 2-15-30, как правило, сыграл лучше, чем герой со счётом 10-9-1, но всё зависит от каждой конкретной ситуации). Чтобы вычислить свой КДА, воспользуйтесь приведённой ниже формулой.

Как считается KDA?

Чтобы узнать свой KDA ratio в Dota 2, необходимо воспользоваться формулой:

где K — убийства, D — количество смертей, A — ассисты (помощи) при убийстве вражеских героев.

Например, KDA ratio героя со счётом 15-5-10 составляет: (15+10)/5=25/5=5.

Источник

18 Jan 2013 в 23:57

18 Jan 2013 в 23:57 #1

18 Jan 2013 в 23:58 #2

18 Jan 2013 в 23:58 #3

18 Jan 2013 в 23:59 #4

18 Jan 2013 в 23:59 #5

19 Jan 2013 в 00:01 #6

19 Jan 2013 в 00:01 #7

лучший K/D/A может быть разный в зависимости от роли героя в игре

19 Jan 2013 в 00:01 #8

19 Jan 2013 в 00:03 #9

В целом можно сказать, по нему надо судить то как ты играешь за персонажа, нежели по винрейту, так как этот показатель, (простите за тавтологию), показывает степень твоей полезности в команде, чем выше, тем ты полезнее.

19 Jan 2013 в 00:04 #10

Наткнулся на тему и решил воспользоваться моментом.
Как считается KDA Ratio на дотабафе?

19 Jan 2013 в 00:07 #11

у меня самый высокий коэф за висажа, за него же и больше всего игр

19 Jan 2013 в 00:07 #12

19 Jan 2013 в 00:08 #13

киллы+ассисты,Как было сказано выше.

19 Jan 2013 в 00:10 #14

И если я правильно понял, чем меньше ратио тем хуже мои дела, так? )

19 Jan 2013 в 00:10 #15

19 Jan 2013 в 00:11 #16

тут и самому догадаться можно (

19 Jan 2013 в 00:11 #17

Главное, чтобы ты хотя бы убивал на 1 больше, чем умер. Ну или ассистил нормально.

19 Jan 2013 в 00:12 #18

если играешь на керри-это вообще нехорошо

Источник

Как работает поиск в Kad Network

Довольно часто встречаются жалобы на то, что в Mainline DHT битторрента нет поиска по ключевым словам. Обычно просьбы о добавлении такого поиска на форумах BitTorrent Inc. игнорируются или получают традиционный ответ о том, что DHT не позволяет искать по ключевым словам, а только по индивидуальным ключам. Это в принципе верно, но существует такой выход из этой прискорбной ситуации как создание инвертированного индекса ключевых слов у каждой ноды.

Собственно так и работает поиск в Kad Network, реализации распределённой хэш-таблицы, основанной на довольно широко используемом протоколе Kademlia. Kad Network используется такими программами как eMule, iMule, aMule и MLDonkey для поиска хэшей файлов по ключевым словам и источников файлов по их хэшам.

Общее описание процесса поиска в Kad Network.
(для лучшего понимания полезно представлять, как работает Kademlia)

Итак, у каждой ноды в сети Kad Network есть 128-битный ID, генерируемый случайно каждый раз при входе в сеть. Для хэширования файлов и слов используется алгоритм, основанный на MD4, что дает распределение хэшей-ключей в том же пространстве, что и ID всех нод. Каждая нода ответственна за хранение нескольких типов информации. Во-первых, каждая нода хранит карту источников, т.е. информацию об участниках сети, которые готовы поделиться определенным файлом. Карта представляет собой хэш файла в качестве ключа и список источников в качестве значения. Карта источников ноды содержит контактную информацию по хэшам всех файлов, чей хэш совпадает с ID ноды или близок к ней (используется XOR-метрика). Так, имея хэш файла, можно найти ноды с ID, близкими к хэшу файла (конкретный механизм поиска примерно соответствует тому, что используется в Kademlia) и запросить у них список источников для закачки файла. Во-вторых, если хэша файла нет, то можно осуществить его поиск по ключевым словам. Для этого имя публикуемого файла разбивается на несколько последовательных слов, и каждое слово хэшируется отдельно. В целях поиска по этим ключевым словам каждая нода имеет вторую карту, которая содержит хэши слов, близких к ID самой ноды, в качестве ключей и хэши файлов и их имена в качестве значений.

Теперь более подробно о том, как осуществляется поиск конкретно в eMule.

Когда инициируется процесс поиска, то создается соответствующий объект и вносится в карту поиска. Каждый поисковый запрос имеет целевой ключ (хэш файла, хэш слова), который ищется в сети Kad Network. Поисковые запросы осуществляются с помощью двух параллельных процессов.
Первый процесс ищет ноды с ID, близкими к ключу-хэшу искомого объекта. Чтобы найти нужные ноды, ищущая нода берет 50 нод с ближайшими к ключу искомого объекта ID из своей таблицы маршрутизации и помещает их во временную карту. Затем ищущая нода начинает обращаться к этим 50 нодам для того, чтобы получить ноды, находящиеся ближе к ключу искомого объекта. Одновременно опрашивается только 3 ноды. Ищущая нода посылает сообщение KADEMLIA_REQ с такими параметрами как ключ объекта (хэш слова, хэш файла или ID ноды) и количество запрошенных нод (т.е. сколько нод запрашиваемая нода должна вернуть в качестве ответа). Последний параметр зависит от типа поискового запроса. Если это поиск ноды, то параметр равен 11, если это поиск источников или поиск по слову, то – 2. Когда нода получает такое сообщение, она отвечает сообщением KADEMLIA_RES с запрошенным количестом контактов (нод). Когда ищущая нода получает это сообщение, она добавляет полученные контакты в свою таблицу маршрутизации и во временную карту текущего поиска. Затем ищущая нода опять опрашивает три ближайших к ключу объекта ноды, но только если их ID ближе к ключу, чем ID нод, которые предоставили их контактную информацию. Эта процедура повторяется до тех пор, пока во временной карте есть новые ноды, чьи ID ближе к ключу искомого объекта. Если ноды не отвечают на запрос KADEMLIA_REQ, то они удаляются.

Второй процесс посылает нодам, которые ответили сообщением KADEMLIA_RES, начиная с ближайшей, соответствующий поисковый запрос в зависимости от того, что ищется. Это может быть SEARCH_REQ для поиска источников или файлов по ключевым словам, PUBLISH_REQ для публикации источников или ключевых слов и т.д. В этих запросах используется дополнительный флаг, принимающий значения 0 или 1, для определения того, что именно запрашивается – источники или хэши с именами по ключевым словам. Когда нода получает такой поисковый запрос, она должна обработать его (поискать запрашиваемую информацию в своей карте ключевых слов или карте источников) и ответить сообщением SEARCH_RES с отобранными результатами. Для каждого типа результатов существует предельная величина, при достижении которой поиск прекращается. Для поиска источников или поиска по ключевым словам эта предельная величина составляет 300 полученных оригинальных объектов. Также поиск источников или файлов останавливается, если прошло 45 секунд с начала поиска.

Полезные статьи:
Petar Maymounkov, David Mazières «Kademlia: A Peer-to-peer information system based on the XOR Metric».
Подробное описание протокола Kad Network:
David Mysicka «Reverse Engineering of eMule: An Analysis of the Implementation of Kademlia in eMule».
Stefan Schmid, Thomas Locher «When KAD meets BitTorrent — Building a Stronger P2P Network».

Источник

«Не проблема изъять участок»: что будет с дачами в Ленобласти, вставшими на пути КАД-2

Новая кольцевая автодорога появится вокруг Петербурга, однако идея со старой «бетонкой» канула в лету, и прокладывать КАД-2 будут с нуля. Почему так получилось, чем грозит новое строительство земельным участкам и дачным массивам, выяснили НЕВСКИЕ НОВОСТИ.

С каждым годом ситуация на дорогах Петербурга усугубляется, на транспортных артериях все чаще случаются заторы и аварии. Город расширяется, и нужны новые трассы. В июле этого года на совещании по развитию петербургского транспортного узла президент России Владимир Путин рассказал о планах проложить КАД-2 в ближайшее время на территории Ленобласти. Предполагалось, что вторая кольцевая будет располагаться дальше существующей примерно на 50 км и прокладываться по «бетонке» — старой военной трассе, построенной в 1970-х годах и выложенной мощными бетонными плитами.

Однако сегодня, 17 ноября, стало известно, что проект второй кольцевой автомобильной дороги вокруг Петербурга предполагает полностью новое строительство. Использовать уже существующие участки дороги не будут. Информацию сообщил председатель правления ГК «Автодор» Вячеслав Петушенко на международном форуме «Транспорт России».

В беседе с экспертами НЕВСКИЕ НОВОСТИ узнали, где может быть проложена новая кольцевая, какие проблемы придется решить городу при ее строительстве и как оно повлияет на дачников и садоводов Ленобласти.

Нужна ли КАД-2 городу?

Весной этого года эксперты выразили сожаление, что дорожное покрытие на кольцевой автомобильной дороге (КАД) быстро изнашивается из-за перегруза. Изначально оно не было рассчитано на такие масштабы автомобильноо потока: высокую скорость и большое количество транзитных грузовиков и фур. Эти факторы привели к ускоренному разрушению покрытия. Строительство второй кольцевой должно существенно разгрузить трассу А-118 — теперь из одного конца города в другой можно будет добраться быстро и легко.

Благодаря второй кольцевой уменьшится количество большегрузов, а это значит, что статистика ДТП в Петербурге должна пойти на убыль, потому что многие крупные аварии происходят на КАД с участием фур. С появлением новой трассы они смогут ездить в обход городской кольцевой.

Андрей Горев, профессор кафедры транспортный систем СПбГАСУ считает, что первая кольцевая уже давно потеряла свою пропускную способность.

«Там можно очень сильно застрять в каком-нибудь заторе, особенно у Витебского моста. Но вопрос насколько эти потоки могут быть отнесены дальше — это вопрос к математикам. Есть математическая модель, которая считает — будет быстрее, если автомобиль поедет в объезд, или не будет. В целом, я думаю, что дорога нужна», — поделился своим мнением эксперт.

С его слов, КАД-2 положительно скажется на развитии Ленобласти, где появятся новые предприятия и жилые кварталы.

Почему не по «бетонке»

Власти реализуют планы, составленные еще в самом конце 90-х при проектировании первой кольцевой дороги. Тогда еще выбирали между двумя маршрутами строительства — по военной «бетонке» в 50 километрах от границ города или по дороге, пролегающей как по территории города, так и затрагивающей область. Правительство выбрало второй вариант, а позже, в конце июля 2021 года, вернулись к обсуждению первого. Однако согласно последним данным, бетонная дорога может быть и проигнорирована. Генеральный директор «Пассажир ТВ», эксперт в сфере транспорта и транспортных инфраструктур Михаил Бурцев пояснил, что такие изменения в планах города связаны, скорее всего, с тем, что строительство новой дороги выйдет гораздо дешевле реконструкции старой «бетонки».

«Сначала должен состояться проект, только после этого будет понятно, как это будет реализовано. В любом случае здесь нужно смотреть экономические аспекты, и они будут во главе угла», — считает эксперт.

Проблемы строительства КАД-2

Бурцев считает, что при прокладке новой кольцевой автодороги возникнут как социальные, так и экономические проблемы. Например, во время строительства первой КАД, ее маршрут менялся 12 раз и это сказывалось на бюджете всего проекта.

«Главной задачей на данном этапе будет согласовать трассу. Именно от самой трассы, от съездов будет зависеть уже денежный аспект, от логистики», — пояснил эксперт.

По его мнению, часть дороги может быть проложена все-таки по «бетонке», а часть — по новому маршруту. Но при этом придется «залезать» на дачные массивы и садоводства.

«Здесь нужно смотреть конкретные участки, что дешевле — выкупить эти участки у владельцев или сделать обход этих участков по другой трассе, увеличив тем самым километраж КАД-2», — уточнил Бурцев.

Однако при строительстве кольцевой экологические нормативы властями города должны быть обязательно учтены.

Что будет с дачами и садоводствами Ленобласти

На маршруте новой кольцевой могут оказаться промышленные предприятия и дачные участки. Как город будет решать этот вопрос, рассказал юрист Юрий Рубин. Оказывается, земельный кодекс предусматривает изъятие земельных участков для государственных нужд. Строительство автомобильных дорог и инженерной инфраструктуры — это те основания, которые предусмотрены земельным кодексом РФ.

«Собственнику, если речь идет о садоводстве — там тонкий момент, я надеюсь, что собственники садоводы все успели оформить — предлагается выкупить земельные участки по их рыночной цене, а кадастровая равна рыночной», — пояснил эксперт.

Петербург и Ленобласть провели большую работу по оценке стоимости всей земли. Государству может быть выгодней выкупать садоводства, поскольку они дешевле, чем земли индивидуального жилищного строительства (ИЖС) в населенных пунктах. Если собственник отказывается от продажи своего участка государству, то суд принудительно изымает землю.

«Единственное основание, по которому вы можете обжаловать, это занижение рыночной стоимости. Но, как правило, возможность изменить стоимость очень невелика, поскольку оценки плюс-минус, исходя из методик и коэффициентов, между собой совпадают», — поделился опытом специалист.

По мнению эксперта, процедура довольно проста и предельно ясно описана в земельном кодексе. К тому же, на эту тему сложилась обширная судебная практика.

«Это не проблема изъять земельный участок для строительства дороги. В среднем, такая процедура от административного до судебного обжалования занимает семь месяцев», — рассказал Рубин.

По мнению экспертов, строительство полной кольцевой автодороги займет около пяти лет, однако реальные сроки будут зависеть от финансирования и задач, которые перед собой поставит город.

Ранее НЕВСКИЕ НОВОСТИ рассказывали, что изменит в жизни петербуржцев запуск новой КАД.

Источник

Метрики в задачах машинного обучения

В задачах машинного обучения для оценки качества моделей и сравнения различных алгоритмов используются метрики, а их выбор и анализ — непременная часть работы датасатаниста.

В этой статье мы рассмотрим некоторые критерии качества в задачах классификации, обсудим, что является важным при выборе метрики и что может пойти не так.

Метрики в задачах классификации

Для демонстрации полезных функций sklearn и наглядного представления метрик мы будем использовать датасет по оттоку клиентов телеком-оператора.

Accuracy, precision и recall

Перед переходом к самим метрикам необходимо ввести важную концепцию для описания этих метрик в терминах ошибок классификации — confusion matrix (матрица ошибок).
Допустим, что у нас есть два класса и алгоритм, предсказывающий принадлежность каждого объекта одному из классов, тогда матрица ошибок классификации будет выглядеть следующим образом:


	True Positive (TP)	False Positive (FP)
	False Negative (FN)	True Negative (TN)

Здесь — это ответ алгоритма на объекте, а — истинная метка класса на этом объекте.
Таким образом, ошибки классификации бывают двух видов: False Negative (FN) и False Positive (FP).

Accuracy

Интуитивно понятной, очевидной и почти неиспользуемой метрикой является accuracy — доля правильных ответов алгоритма:

Эта метрика бесполезна в задачах с неравными классами, и это легко показать на примере.

Допустим, мы хотим оценить работу спам-фильтра почты. У нас есть 100 не-спам писем, 90 из которых наш классификатор определил верно (True Negative = 90, False Positive = 10), и 10 спам-писем, 5 из которых классификатор также определил верно (True Positive = 5, False Negative = 5).
Тогда accuracy:

Однако если мы просто будем предсказывать все письма как не-спам, то получим более высокую accuracy:

При этом, наша модель совершенно не обладает никакой предсказательной силой, так как изначально мы хотели определять письма со спамом. Преодолеть это нам поможет переход с общей для всех классов метрики к отдельным показателям качества классов.

Precision, recall и F-мера

Для оценки качества работы алгоритма на каждом из классов по отдельности введем метрики precision (точность) и recall (полнота).

Precision можно интерпретировать как долю объектов, названных классификатором положительными и при этом действительно являющимися положительными, а recall показывает, какую долю объектов положительного класса из всех объектов положительного класса нашел алгоритм.

Именно введение precision не позволяет нам записывать все объекты в один класс, так как в этом случае мы получаем рост уровня False Positive. Recall демонстрирует способность алгоритма обнаруживать данный класс вообще, а precision — способность отличать этот класс от других классов.

Как мы отмечали ранее, ошибки классификации бывают двух видов: False Positive и False Negative. В статистике первый вид ошибок называют ошибкой I-го рода, а второй — ошибкой II-го рода. В нашей задаче по определению оттока абонентов, ошибкой первого рода будет принятие лояльного абонента за уходящего, так как наша нулевая гипотеза состоит в том, что никто из абонентов не уходит, а мы эту гипотезу отвергаем. Соответственно, ошибкой второго рода будет являться «пропуск» уходящего абонента и ошибочное принятие нулевой гипотезы.

Precision и recall не зависят, в отличие от accuracy, от соотношения классов и потому применимы в условиях несбалансированных выборок.
Часто в реальной практике стоит задача найти оптимальный (для заказчика) баланс между этими двумя метриками. Классическим примером является задача определения оттока клиентов.
Очевидно, что мы не можем находить всех уходящих в отток клиентов и только их. Но, определив стратегию и ресурс для удержания клиентов, мы можем подобрать нужные пороги по precision и recall. Например, можно сосредоточиться на удержании только высокодоходных клиентов или тех, кто уйдет с большей вероятностью, так как мы ограничены в ресурсах колл-центра.

Обычно при оптимизации гиперпараметров алгоритма (например, в случае перебора по сетке GridSearchCV ) используется одна метрика, улучшение которой мы и ожидаем увидеть на тестовой выборке.
Существует несколько различных способов объединить precision и recall в агрегированный критерий качества. F-мера (в общем случае ) — среднее гармоническое precision и recall :

в данном случае определяет вес точности в метрике, и при это среднее гармоническое (с множителем 2, чтобы в случае precision = 1 и recall = 1 иметь )
F-мера достигает максимума при полноте и точности, равными единице, и близка к нулю, если один из аргументов близок к нулю.
В sklearn есть удобная функция _metrics.classificationreport, возвращающая recall, precision и F-меру для каждого из классов, а также количество экземпляров каждого класса.

class	precision	recall	f1-score	support
Non-churned	0.88	0.97	0.93	941
Churned	0.60	0.25	0.35	159
avg / total	0.84	0.87	0.84	1100

Здесь необходимо отметить, что в случае задач с несбалансированными классами, которые превалируют в реальной практике, часто приходится прибегать к техникам искусственной модификации датасета для выравнивания соотношения классов. Их существует много, и мы не будем их касаться, здесь можно посмотреть некоторые методы и выбрать подходящий для вашей задачи.

AUC-ROC и AUC-PR

При конвертации вещественного ответа алгоритма (как правило, вероятности принадлежности к классу, отдельно см. SVM) в бинарную метку, мы должны выбрать какой-либо порог, при котором 0 становится 1. Естественным и близким кажется порог, равный 0.5, но он не всегда оказывается оптимальным, например, при вышеупомянутом отсутствии баланса классов.

Одним из способов оценить модель в целом, не привязываясь к конкретному порогу, является AUC-ROC (или ROC AUC) — площадь (Area Under Curve) под кривой ошибок (Receiver Operating Characteristic curve ). Данная кривая представляет из себя линию от (0,0) до (1,1) в координатах True Positive Rate (TPR) и False Positive Rate (FPR):

TPR нам уже известна, это полнота, а FPR показывает, какую долю из объектов negative класса алгоритм предсказал неверно. В идеальном случае, когда классификатор не делает ошибок (FPR = 0, TPR = 1) мы получим площадь под кривой, равную единице; в противном случае, когда классификатор случайно выдает вероятности классов, AUC-ROC будет стремиться к 0.5, так как классификатор будет выдавать одинаковое количество TP и FP.
Каждая точка на графике соответствует выбору некоторого порога. Площадь под кривой в данном случае показывает качество алгоритма (больше — лучше), кроме этого, важной является крутизна самой кривой — мы хотим максимизировать TPR, минимизируя FPR, а значит, наша кривая в идеале должна стремиться к точке (0,1).

Критерий AUC-ROC устойчив к несбалансированным классам (спойлер: увы, не всё так однозначно) и может быть интерпретирован как вероятность того, что случайно выбранный positive объект будет проранжирован классификатором выше (будет иметь более высокую вероятность быть positive), чем случайно выбранный negative объект.

Рассмотрим следующую задачу: нам необходимо выбрать 100 релевантных документов из 1 миллиона документов. Мы намашинлернили два алгоритма:

Скорее всего, мы бы выбрали первый алгоритм, который выдает очень мало False Positive на фоне своего конкурента. Но разница в False Positive Rate между этими двумя алгоритмами крайне мала — всего 0.0019. Это является следствием того, что AUC-ROC измеряет долю False Positive относительно True Negative и в задачах, где нам не так важен второй (больший) класс, может давать не совсем адекватную картину при сравнении алгоритмов.

Для того чтобы поправить положение, вернемся к полноте и точности :

Здесь уже заметна существенная разница между двумя алгоритмами — 0.855 в точности!

Precision и recall также используют для построения кривой и, аналогично AUC-ROC, находят площадь под ней.

Здесь можно отметить, что на маленьких датасетах площадь под PR-кривой может быть чересчур оптимистична, потому как вычисляется по методу трапеций, но обычно в таких задачах данных достаточно. За подробностями о взаимоотношениях AUC-ROC и AUC-PR можно обратиться сюда.

Logistic Loss

Особняком стоит логистическая функция потерь, определяемая как:

здесь — это ответ алгоритма на -ом объекте, — истинная метка класса на -ом объекте, а размер выборки.

Подробно про математическую интерпретацию логистической функции потерь уже написано в рамках поста про линейные модели.
Данная метрика нечасто выступает в бизнес-требованиях, но часто — в задачах на kaggle.
Интуитивно можно представить минимизацию logloss как задачу максимизации accuracy путем штрафа за неверные предсказания. Однако необходимо отметить, что logloss крайне сильно штрафует за уверенность классификатора в неверном ответе.

Отметим, как драматически выросла logloss при неверном ответе и уверенной классификации!
Следовательно, ошибка на одном объекте может дать существенное ухудшение общей ошибки на выборке. Такие объекты часто бывают выбросами, которые нужно не забывать фильтровать или рассматривать отдельно.
Всё становится на свои места, если нарисовать график logloss:

Видно, что чем ближе к нулю ответ алгоритма при ground truth = 1, тем выше значение ошибки и круче растёт кривая.

Подытожим:

Полезные ссылки

Благодарности

Спасибо mephistopheies и madrugado за помощь в подготовке статьи.

Источник