Что такое lnr видеокарты
реклама
Если вы всё ещё сомневаетесь в том, что защита пробита, можете сразу же переходить к видео ниже. Мы же кратко расскажем о случившемся. Итак, в новой версии появилась расширенная настройка, где присутствует аргумент под названием lhr. Именно он отвечает за блокировку майнинга на видеокартах. Поскольку это первая версия, в которой есть подобные настройки, то ждать чудес не стоит. Так, пока доступна максимальный параметр равный 68. Это значит, что вы получаете 68% от максимального хешрейта на заблокированной видеокарте, или на 20% больше возможного. Майнеры с канала Dizzy Mining опытным путём выяснили, что более высокое значение должно приводить к более высокому показателю хешрейта, но уже через короткий промежуток времени это вызовет блокировку, что автоматически снизит хешрейт до стандартного.
Майнеры определили, что большинство попавших им в руки видеокарт NVIDIA LHR без проблем увеличивают показатель хешрейта на 68% от возможного. Если вы обнаружите резкое падение – сбросьте показатель до 65. Кроме того, можно провести такую же настройку, если у вас несколько видеокарт. Для этого нужно после атрибута lhr перечислить показатель хешрейта для каждого графического чипа через запятую. При этом, если одна из видеокарт поставляется без LHR, то нужно установить «-1». Давайте к примерам: lhr 65,68,0,-1.
По мнению представителей Wccftech, в ближайшее время разблокировка может ощутимо увеличить цену на видеокарты, а эффективность разблокировки будет расти. Это не значит, что майнерам удастся разблокировать все 100%, но даже 85% будет достаточно, чтобы уйти в плюс, а там многие из фермеров рассчитывают на рост Эфира.
Как отличить и определить LHR видеокарты и как это работает
Конечно, речь в первую очередь пойдет о рынке видеокарт и о том, как киты борются с возникшим дефицитом. Все взволнованы резким и чрезмерным повышением цен на комплектующие ПК. Но именно мощные GPU-процессоры оказались под прицелом любителей децентрализованных денег. Благодаря резкому росту цен на вирутальные активы, простоте добычи новых монеток и понимания, что за криптой будущее, видеокарт на полках магазинов не осталось.
Но это совершенно не беда. Сейчас мы научимся отличать нужные нам видеокарты от не совсем подходящих и определим наиболее точный и рациональный способ определения отсутствия LHR на комплектующей.
1-ый способ: по названию
Для начала стоит запомнить одно важное обстоятельство: если вы решили обзавестись новенькой RTX 3090, то нижесказанное вас не будет касаться. Они не имеют каких-либо ограничений и идеально подходят как для майнинга, так и для иных целей.
Как уже говорилось ранее, производитель не обязан указывать эту особенность на продукции. Но часто такое указание делается. Нужно знать, например, что для 3060 не делается вообще каких-то маркировок, хоть она и имеет, по сути, два вида блокировки майнинга. Как программную, так и аппаратную. Видимо поэтому Nvidia решили не утруждать себя, видеокарта же изначально была не для майнеров!
Если рассматривать Nvidia RTX 3070 Ti и RTX 3080 Ti как вариант приобретения, то все они будут идти с LHR без исключения.
Возьмём серию RTX 3060Ti, RTX 3070 и RTX 3080. Эти видеокарты могут быть как с LHR, так и не относится к новой ревизии, когда ещё не было ограничителя майнинга. В этой серии производитель старается указывать в самом названии особенности продукта, чтоб не было потом гневных отзывов в интернете.
Исходя из нынешней политики Nvidia, можно однозначно утверждать только то, что если на коробочке написано «LHR», то хешрейт будет занижен. Если же таких пометок нет, то подойдет другой способ оценки дееспособности аппаратуры.
2-ой способ: проверка по GPU ID
Суть способа, думается, ясна из самого названия. Осталось только определиться, каким образом этот самый GPU ID можно узнать?
Это делается довольно просто. Нам понадобится установить карту в ПК и запустить программу CPU-Z. Не только она позволяет узнать ID, но рассмотрим на её примере. При запуске по вкладке “Graphics” в строке Code name вы сможете увидеть, имеется ли аппаратный ограничитель майнинга или нет.
Такой способ не подойдет при покупке видеокарты через интернет. Ведь для его реализации необходима возможность установки её в компьютер. Этот способ идеален для вторичного рынка или же при покупке в розничных сетях, если вам удастся договориться с продавцом. Ещё один большой плюс заключается в том, что этот способ проверки является самым точным. Здесь ошибиться будет невозможно.
Способы определения видеокарт Nvidia Geforce RTX 30 с ограничителем майнинга LHR

1 Способ. По названию.
Все видеокарты RTX 3090 не имеют ограничений в майнинге.
Видеокарта RTX 3060 имеет два вида блокировки программную, которую уже взломали, и LHR. Маркировка LHR для этой видеокарты так же не указывается, т.к. эти видеокарты изначально выпускались с блокировкой майнинга.
Видеокарты Nvidia RTX 3070 Ti и RTX 3080 Ti все с ограничителем майнинга LHR, даже если это и не указано в названии и на коробке с видеокартой.
Для видеокарт RTX 3060Ti, RTX 3070 и RTX 3080 производитель может указать на коробке или в названии о принадлежности продаваемой видеокарты к новой ревизии, в которой реализованна технология Lite Hash Rate (LHR). В этом случае сразу понятно, что в майнинге такие видеокарты будут показывать заниженный хешрейт.
Если в названии модели нет указаний, что это LHR модель, то к сожалению, это не означает, что это старая ревизия без ограничений в майнинге. Это может быть как LHR так и обычная видеокарта.
По каким причинам производители вводят покупателей в заблуждение: намеренно или нет. Остается только догадываться.
Если Вам попалась видеокарта без обозначения LHR, то для проверки такой видеокарты на ограничение в майнинге воспользуетесь другими способами.
2 Способ. По GPU ID
Это самый надежный способ проверки на наличие LHR в видеокарте компании Nvidia, но для этого необходимо проверяемую видеокарту установить в компьютер и запустить программу СPU-Z или аналогичную в которой есть возможность узнать GPU ID видеокарты.
Понятно, что при покупке видеокарты под заказ или в интернет магазине такой возможности у Вас точне не будет, поэтому такой способ больше подойдет при покупке видеокарт на вторичном рынке или в местном магазине у которого можно вернуть товар в первые дни после покупки.
Все GPU ID видеокарт Nvidia RTX 3000
| Видеокарта | GPU ID | LHR | Подробнеее |
| RTX 3060 | GA106-300 | — | Программный LHR |
| GA106-302 | LHR | ||
| RTX 3060 Ti | GA104-200 | — | |
| GA104-202 | LHR | ||
| RTX 3070 | GA104-300 | — | |
| GA104-302 | LHR | ||
| RTX 3070 Ti | GA104-400 | LHR | |
| RTX 3080 | GA102-200 | — | |
| GA102-202 | LHR | ||
| RTX 3080 Ti | GA102-225 | LHR | |
| RTX 3090 | GA102-300 | — |
3 Способ. По обозначению модели
Все видеокарты в зависимости от модели и производителя имеют свой уникальный номер или код продукта. У каждой компании в этом отношении свои правила по обозначению различных моделей видеокарт и их исполнения.
Эти обозначения всегда можно посмотреть на коробке от видеокарты или на самой видеокарте, так же обозначение кода продукта часто указывается на сайтах компьютерных магазинов.
С выходом LHR модификаций все производители выпустили новые ревизии видеокарт, что отразилось в их обозначении:
ASUS — отмечает LHR версии видеокарт индексом V2
Gigabyte — маркирует LHR видеокарты как Rev. 2.0
MSI, Zotac— пишут просто и понятно LHR
Palit, Gainward — маркирует LHR видеокарты суффиксом V1
EVGA — код модели LHR заканчивается буквами KL
4 Способ. По дате выпуска (серийному номеру)
Кроме обозначения модели у каждой видеокарты есть серийный номер, по которому можно определить дату выпуска данной видеокарты. Обозначение даты выпуска для каждого производителя в серийном номере так же отличается и не имеет единой системы. Поэтому для каждого производителя рассмотрим обозначение дат в серийных номерах отдельно.
Определение даты выпуска видеокарт Nvidia по серийному номеру
Серийный номер компании ASUS: M2 N0CX00Y276001
Серийный номер компании Gigabyte: SN 2125 41020415
где 2125 это 21 год и 25 неделя. Поэтому с большой вероятностью это видеокарта будет с LHR.
Серийный номер компании Palit: B O20 0154221
Серийный номер компании MSI: 602-V389-143SB 2106 000014
где 2106 это 21 год 6 месяц
Для видеокарт Zotac, EVGA, KFA2 и Inno3D мы не нашли информации как определить по серийному номеру дату производства. Если у Вас есть такая информация, то поделитесь ею с нами в телеграм чате Cryptoage.
5 Способ. По маркировке GPU чипа.
Узнать GPU ID видеочипа можно так же разобрав видеокарту и удалив термопасту с чипа, где будет гравировка с GPU ID. В этом способе нет необходимости, т.к. GPU ID можно узнать с помощью программы CPU-Z, тем более что при разборке видеокарты теряется гарантия и вернуть такую видеокарту в магазин по гарантии уже не получится.
Дата производства видеокарты после 22 недели 2021 года, т.е. после мая 2021 года, не означает что все видеокарты выпущенные после этой даты имеют ограничение майнинга LHR, т.к. у производителей еще остались запасы старых GPU чипов, которые они постепенно используют в производстве. Соответственно, чем позже выпуск видеокарты, тем меньше шансов купить видеокарту Nvidia без ограничетеля в майнинге.
Подпишись на наш Telegram канал @cryptoage и Вконтакте, узнавай новости про криптовалюты первым.
Общайся с криптоэнтузиастами и майнерами в Telegram чате @CryptoChat
Видеокарта LHR: чем отличается от обычной и зачем нужна
Майнинговый бум, который начался зимой прошлого года, привел практически к полному исчезновению из продажи пользовательских игровых видеокарт. А то, что можно найти в магазинах, стоит неоправданно дорого. В результате игроки и владельцы настольных ПК средней производительности остались крайне недовольны текущем положением дел. Чтоб защитить их интересы некоторые производители видеокарт выпустили модели LHR.
Что такое видеокарта LHR?
Аббревиатура LHR произошла от определения Low Hash Rate, что означает «низкая скорость хеширования». Этот термин введен компанией NVIDIA для обозначения видеокарт, которые на аппаратном уровне имеют ограничения, не позволяющие использовать их для майнинга самых популярных криптовалют.
Карты для майнинга получили аббревиатуру CMP от Crypto Mining Professional – профессиональный майнинг криптовалют. Обычна эта маркировка указывается в названии моделей, а сама карта для майнинга лишена видеовыходов.
Ранее уже предпринимались попытки защитить видеокарты от майнинга – в декабре 2020 года. Но реализовано это было только на программном уровне – определенные алгоритмы были прописаны в новых драйверах. Программа определяла наличие в системе двух и более графических адаптеров и снижала производительность каждого. Естественно, надежной такая защита не стала, и в сети быстро распространились пакеты новых, оптимизированных драйверов со взломанной защитой.
Поэтому инженеры компании NVIDIA приступили к разработке модифицированных микрочипов, которые имели аппаратную защиту, встраиваемую при производстве.
Видеокарты LHR появились в продаже в мае 2021 года. Первой моделью с аппаратной защитой от майнинга стала RTX 3060. Позже защитой обзавелись и другие графические адаптеры, но только те, процессор которых создан на базе архитектуры Ampere. На данный момент, помимо первой пробной, в категории защищенных выпускаются:
Кстати, компания не планирует отказываться от широкого рынка майнинга и предлагает энтузиастам криптовалюты следующие модели графических адаптеров NVIDIA CMP:
Конечно рекомендованная цена на них изначально больше, чем на игровые.
Почему для майнинга используются именно видеокарты?
Криптовалюты «добываются» определенными вычислениями, которые производят процессоры. У графического процессора вычислительных ядер значительно больше, чем у центрального, к тому же они могут работать параллельно и независимо друг от друга. Например, у видеокарт линейки RTX 2070 Super ядер CUDA 2560 единиц. Ядра центральных процессоров демонстрируются в первых строках спецификации. Новейшее 11-е поколение процессоров Intel может похвастаться максимум 8 ядрами у процессоров Core i9.
Поскольку за один такт ядро процессора способно выполнить одну операцию, разница в производительности GPU и CPU очевидна. А если в расчет взять еще и более скоростную оперативную память GDDR6, которой оснащаются современные видеокарты, то высокая результативность вычислений гарантирована.
Как работает защита?
Поскольку продукция компании NVIDIA проприетарная (частная, патентованная, с правом на собственность), документации или каких-либо официальных сведений о системе защиты нет. Такое положение дополнительно защищает графические процессоры от майнеров и энтузиастов, которые могут попытаться вмешаться в структуру GPU для снятия защиты.
Известно, что для идентификации новейших видеокарт операционной системой используются коды в рамках 16-значной системы PCI Device ID. Каждая модель видеокарты от каждого производителя имеет свой уникальный идентификационный номер. Эти коды распознаются только последними версиями программного обеспечения. ПО от NVIDIA закрыто и недоступно энтузиастам, подправить коды на данный момент невозможно, но зарекаться не стоит.
Именно идентификационный номер, физически прописанный на микрочипе видеокарты, в совокупности с соответствующими драйверами накладывают ограничение на выполнение определенных задач. К этим задачам и относятся многоступенчатые простые вычисления, при помощи которых добываются криптомонеты.
Выходом на сегодняшний день может стать только изменение алгоритмов майнинга. Но это невозможно по причине одного из главных принципов добычи криптовалюты, заложенного создателем биткоина – децентрализации. За выпуск криптовалюты никто не отвечает, и никто не контролирует, алгоритмы майнинга доступны каждому желающему.
На практике защита выглядит следующим образом. Если использовать LHR видеокарты для майнинга, их производительность автоматически снижается вдвое, но энергопотребление сохраняется в полном объеме. Это значит, что покупка такого дорогостоящего оборудования становится нецелесообразной, как и сам майнинг с повышенным потреблением электроэнергии при низкой производительности. При этом рядовые пользовательские задачи выполняются без ограничений: запуск и воспроизведение игр, обработка видео и фото, 3D-моделирование.
Таким образом, если пользователь, покупая видеокарту планирует днем играть или работать, а ночью запускать добычу цифровых монет, следует ориентироваться на покупку карт без защиты LHR.
Как распознать LHR видеокарты?
Распознать видеокарты с защитой можно по маркировке. Однако, вендоры используют различные обозначения:
Кстати защищенные видеокарты стоят дешевле. Может быть поэтому на рынке видеокарт наблюдается постепенный откат от немыслимых цен на графические адаптеры. Конечно до нормализации ситуации еще очень далеко, но надежда на доступные игровые карты по ценам рекомендованным производителям все-таки появилась.
FAQ по видеокартам GeForce: что следует знать о графических картах?
Страница 4: GPU
Что скрывается за потоковым процессором, блоком шейдеров или ядром CUDA?
Потоковый процессор обрабатывает непрерывный поток данных, которых насчитываются многие сотни, причем они выполняются параллельно на множестве потоковых процессоров. Современные GPU оснащаются несколькими тысячами потоковых процессоров, они отлично подходят для задач с высокой степенью параллельности. Это и рендеринг графики, и научные расчеты. Что, кстати, позволило GPU закрепиться в серверном сегменте в качестве вычислительных ускорителей.
Еще одним шагом дальше можно назвать интеграцию ядер Tensor в архитектуру NVIDIA Ampere, которые способны эффективно вычислять менее сложные числа INT8 и INT4, но об этом мы поговорим чуть позже.
В составе GPU GA102 имеются семь кластеров Graphics Processing Clusters (GPC) с 12 потоковыми мультипроцессорами Streaming Multiprocessors (SM) каждый. Но на видеокартах GeForce RTX 3090 и GeForce RTX 3080 активны не все SM. GA102 GPU теоретически содержит 10.752 блоков FP32 (7 GPC x 12 SM x 128 блоков FP32). Но у GeForce RTX 3090 два SM отключены, поэтому видеокарта предлагает «всего» 10.496 блоков FP32. Такой подход повышает выход годных чипов NVIDIA, поскольку наличие одного-двух дефектных SM не приводит к отбраковке кристалла.
В случае GeForce RTX 3080 один кластер GPC полностью отключен, поэтому на GA102 GPU остаются шесть GPC, но только четыре из них содержат полные 12 SM, два ограничены десятью SM. Что дает в сумме 8.704 блока FP32 в составе 68 SM.
NVIDIA масштабирует архитектуру Ampere с видеокарты GeForce RTX 3060 вплоть до GeForce RTX 3090. Ниже представлен обзор видеокарт GeForce RTX 30:
| GeForce RTX 3090 | GeForce RTX 3080 Ti | GeForce RTX 3080 | GeForce RTX 3070 Ti | |
| GPU | Ampere (GA102) | Ampere (GA102) | Ampere (GA102) | Ampere (GA104) |
| Число транзисторов | 28 млрд. | 28 млрд. | 28 млрд. | 17,4 млрд. |
| Техпроцесс | 8 нм | 8 нм | 8 нм | 8 нм |
| Площадь кристалла | 628,4 мм² | 628,4 мм² | 628,4 мм² | 392,5 мм² |
| Число FP32 ALU | 10.496 | 10.240 | 8.704 | 6.144 |
| Число INT32 ALU | 5.248 | 5.120 | 4.352 | 3.072 |
| Число SM | 82 | 80 | 68 | 48 |
| Ядра Tensor | 328 | 320 | 272 | 192 |
| Ядра RT | 82 | 80 | 68 | 48 |
| Базовая частота | 1.400 МГц | 1.365 МГц | 1.440 МГц | 1.580 МГц |
| Частота Boost | 1.700 МГц | 1.665 МГц | 1.710 МГц | 1.770 МГц |
| Емкость памяти | 24 GB | 12 GB | 10 GB | 8 GB |
| Тип памяти | GDDR6X | GDDR6X | GDDR6X | GDDR6X |
| Частота памяти | 1.219 МГц | 1.188 МГц | 1.188 МГц | 1.188 МГц |
| Ширина шины памяти | 384 бит | 384 бит | 320 бит | 256 бит |
| Пропускная способность памяти | 936 Гбайт/с | 912 Гбайт/с | 760 Гбайт/с | 608 Гбайт/с |
| TDP | 350 Вт | 350 Вт | 320 Вт | 290 Вт |
| GeForce RTX 3070 | GeForce RTX 3060 Ti | GeForce RTX 3060 | |
| GPU | Ampere (GA104) | Ampere (GA104) | Ampere (GA106) |
| Число транзисторов | 17,4 млрд. | 17,4 млрд. | 12 млрд. |
| Техпроцесс | 8 нм | 8 нм | 8 нм |
| Площадь кристалла | 392,5 мм² | 392,5 мм² | 276 мм² |
| Число FP32 ALU | 5.888 | 4.864 | 3.584 |
| Число INT32 ALU | 2.944 | 2.432 | 1.792 |
| Число SM | 46 | 38 | 28 |
| Ядра Tensor | 184 | 152 | 112 |
| Ядра RT | 46 | 38 | 28 |
| Базовая частота | 1.500 МГц | 1.410 МГц | 1.320 МГц |
| Частота Boost | 1.730 МГц | 1.665 МГц | 1.780 МГц |
| Емкость памяти | 8 GB | 8 GB | 12 GB |
| Тип памяти | GDDR6 | GDDR6 | GDDR6 |
| Частота памяти | 1.725 МГц | 1.750 МГц | 1.875 МГц |
| Ширина шины памяти | 256 бит | 256 бит | 192 бит |
| Пропускная способность памяти | 448 Гбайт/с | 448 Гбайт/с | 360 Гбайт/с |
| TDP | 220 Вт | 200 Вт | 170 Вт |
Одновременное выполнение операций с целыми числами и числами с плавающей запятой
Как мы уже упоминали, вычислительные блоки FP32 могут работать в режиме 2x FP16, то же самое касается INT16. Чтобы увеличить вычислительную производительность и сделать ее более гибкой, в архитектуре NVIDIA Turing появилась возможность одновременного расчета чисел с плавающей запятой и целых чисел. Конечно, подобная возможность сохранилась и в архитектуре Ampere. NVIDIA проанализировала данные вычисления в конвейере рендеринга в десятках игр, обнаружив, что на каждые 100 расчетов FP выполняется примерно треть вычислений INT. Впрочем, значение среднее, на практике оно меняется от 20% до 50%. Конечно, если вычисления FP и INT будут выполняться одновременно, то конвейеру придется иногда «подтормаживать» в случае взаимных связей.
Соотношение 1/3 INT32 и 2/3 FP32 отражено в структуре Ampere Streaming Multiprocessor (SM), составляющем элементе архитектуры Ampere. NVIDIA удвоила число вычислительных блоков FP32 на каждый SM. Вместо 64 блоков FP32 на SM, их теперь насчитывается 128. Плюс 64 блока INT32. Теперь на квадрант SM насчитывается два пути данных, некоторые могут работать параллельно. Один из путей данных содержит 16 блоков FP32, то есть может выполнять 16 вычислений FP32 за такт. Второй путь данных содержит по 16 блоков FP32 и INT32. Каждый из квадрантов SM может выполнять либо 32 операции FP32, либо по 16 операций FP32 и INT32 за такт. Если же брать SM целиком, то возможно выполнение 128 операций FP32 или по 64 операции FP32 и INT32 за такт.
Параллельное выполнение продолжается и на других блоках. Например, ядра RT и Tensor могут работать параллельно в конвейере рендеринга, что снижает время, требующееся на рендеринг кадра.
Под термином «потоковые процессоры» сегодня подразумевают количество вычислительных блоков GPU, хотя следует помнить, что сложность вычислений бывает разной. Поэтому термин используется гибко, но обычно все равно описывает вычислительные блоки.
Текстурные блоки
Действительно, для рендеринга объекта простых текстур уже недостаточно, использование нескольких слоев позволяет, например, получить 3D-эффект вместо плоской текстуры. Раньше объекты приходилось рассчитывать на конвейере несколько раз, и каждый проход текстурный блок накладывал текстуру, сегодня достаточно одного процесса рендеринга, текстурный блок может получать данные объекта для многократной обработки из буфера.
Контроллер памяти
Помимо изменений в SM, новая архитектура NVIDIA получила оптимизированную структуру конвейеров растровых операций (ROP), а также соединения ROP и контроллера памяти. До поколения Turing ROP всегда подключались к интерфейсу памяти. И на каждый 32-битный контроллер памяти приходилось восемь ROP. Если число контроллеров памяти и ширина шины менялись, то же самое касалось и ROP. В архитектуре Ampere ROP перенесены в GPC. Используются два раздела ROP на GPC, каждый раздел содержит восемь ROP.
Что дает иную формулу вычисления ROP на GeForce RTX 3080. Шесть GPC с 2x 8 ROP на каждом дают 96 ROP. У GeForce RTX 3090 работают семь GPC с 2x 8 ROP, что дает 112 ROP. NVIDIA намеренно интегрировала ROP глубже, чтобы задняя часть конвейера рендеринга меньше зависела от интерфейса памяти. Например, видеокарта GeForce RTX 3080 использует 320-битный интерфейс памяти, но содержит 96 ROP, а не 80 ROP.
Интерфейс памяти разделен на 32-битные блоки. В зависимости от желаемой ширины интерфейса памяти или емкости, их можно набирать в произвольном количестве.
Ядра Tensor и RT
Ядра Tensor третьего поколения
С архитектурой Turing NVIDIA представила два новых вычислительных блока, ранее на GPU не использовавшихся. Конечно, ядра Tensor знакомы нам по архитектуре Volta, но там они использовались для научных расчетов. В случае GPU Ampere ядра Tensor перешли уже на третье поколение.
Ядра Tensor ранее использовались только для вычислений INT16 и FP16, но в третьем поколении они могут работать с FP32 и FP64. Что особенно важно для сегмента HPC с высокой точностью. Для игровых GPU GeForce намного важнее меньшая точность.
Ядра Tensor архитектуры Turing могут выполнять 64 операции FP16 Fused Multiply-Add (FMA) каждое. В случае Ampere число операций увеличено до 128 у GA102 GPU и до 256 у GA100 GPU с плотными матрицами. Если же используются разреженные матрицы, число операций FMA FP16 увеличивается до 256 у GA102 GPU и до 512 у GA100 GPU. Ядра Tensor архитектуры Turing разреженные матрицы не поддерживают.
Ядра RT второго поколения
Все они опираются на тот принцип, что удаленные от луча примитивы не могут с ним пересекаться. Следовательно, и смысла их просчитывать нет. Число лучей на сценах растет экспоненциально, поэтому на каждый луч следует обрабатывать как можно меньшее число примитивов, чтобы не увеличивать вычислительную нагрузку.
Поскольку NVIDIA не изменила число ядер RT на SM в архитектуре Ampere, количество блоков SM на GPU по-прежнему определяет производительность RT. Но в ядрах RT есть другие оптимизации.
Одна из проблем с расчетом пересечений при трассировке лучей связана с движущимися объектами, особенно если используется эффект размытия движения (motion blur). Для ядер RT в архитектуре Turing такой сценарий является «узким местом». Но второе поколение ядер RT уже лучше справляется с интерполяцией эффекта размытия движения. Пересечения просчитываются с упреждением, в итоге трассировка лучей рассчитываются только для тех областей, где она необходима.
Кэши L1 и L2
Между функциональными блоками (потоковые процессоры, ядра RT и Tensor) и видеопамятью располагаются еще два уровня хранения данных, без которых GPU не смог бы выдавать высокий уровень производительности. Цель этих кэшей заключается в том, чтобы хранить информацию как можно ближе к функциональным блокам. Данные передаются из видеопамяти сначала в кэш L2, а затем и в кэш L1.
NVIDIA с архитектурой Ampere вновь увеличила кэш L1 с 96 до 128 кбайт. Скорость работы L1 была вновь удвоена. NVIDIA реализовала такую же меру ранее при переходе с Pascal на Turing. Число 32-битных регистров не изменилось и осталось на уровне 16.384. То же самое касается числа блоков чтения/записи.








