Кастомизация охлаждения Tesla P40После того как я попробовал локальный инференс на ноутбуке, мне понравилось это дело и я купил видеокарту Tesla P40 за ≈35000р на Авито.
Для тестирования я собрал открытый стенд на материнской плате Lenovo RD450X (≈7000р) с двумя процессорами XEON E5-2620v4 и двумя плашками ОЗУ ECC по 8гб каждая.
В исходном виде карта попала ко мне в руки с двумя серверными кулерами Arctic S4028-15k с креплением на специальный переходник, а весь открытый стенд выглядел так:

Tesla P40 потребляет всего 250ватт, в комплекте шел кабель переходник 2 PCI-коннектора на CPU, оказывается Tesla имеет разъем питания CPU.

Инструкция по установке драйвера NVIDIA 580 на Debian для Tesla P40, а здесь инструкция по запуску моделей ИИ на llamacpp.
Без турбин Arctic S4028-15k карта быстро нагревается свыше 70°, поэтому обдув обязательно нужен. Кроме того, при первых тестах у меня грелась задняя часть карты, для чего я направил воздух от 12мм корпусного вентилятора ПК:

Для тестов на пару часов такая система охлаждения вполне сойдет, но работать часами в одной комнате с этими серверными турбинами невозможно.
На оборотах выше среднего они издают шум около
50дБ(на уровне обычного ПК во время нагрузки), но это высокочастотный шум, который режет слух.
В интернетах можно найти много вариаций на эту тему, но для эффективного охлаждения нужно сильное статическое давление.

Тут мне пришлось углубиться в тему и разобраться почему же так некомфортно при этом шуме. Оказывается, все дело в типе обдува: корпусные вентиляторы и серверные турбины работают по-разному.
Вентиляторам важно направить воздушный поток, но его сила и мощность не так уж и важны, надо просто дуть чтобы воздух как-то двигался создавая вентиляцию.
А серверные турбины должны толкать воздух через ребра радиаторов превозмогая сопротивление. Отсюда, разница в конструкции и скорости вращения.
Серверные турбины имеют продолговатые лопасти и развивают большую скорость создавая давление воздуха.
Например, те что шли в комплекте с картой могли вращаться со скоростью до 15000 оборотов в минуту, кроме того что такие обороты создают много трения внутри подшипника, так еще и лопасти буквально "разрезают воздух" под давлением и выталкивают его наружу.

Турбина имеет большой статический напор, а корпусный вентилятор - высокий воздушный поток, но низкий напор.
Ситуация меня не устраивала, поэтому нужно искать альтернативу.
Здесь упоминается о возможной совместимости Tesla P40 с системой охлаждения от видеокарт 10-ой серии, то есть 1060, 1070, 1080.
Взяв эту мысль за основу я отправился разбирать свою карту.
Разобрав карту я понял что термопыль термопрокладки в ней никогда не менялись, а весь вытекший из них силикон залил плату и охлаждение.

Удалив остатки ненужного я прочистил плату ваткой смоченной в бензине "Калоша", никакие другие популярные средства не помогли избавиться от этого жира (спирт, обезжириватель, ацетон). Термопрокладки взял самые обычные.
Имея на руках саму плату я отправился гуглить картинки разобранных видеокарта и видеоразборы, прикидывал по экрану монитора сопоставление отверстий и компонентов на своей плате к тому что было на экране. Так я подобрал 2 донора.
Стоит отметить что сами по себе системы охлаждения для этих карт редкость, потому что карты достаточно старые, а покупать видеокарту для того чтобы снять с нее охлаждение нерационально. Поэтому один из вариантов это искать нерабочую видеокарту в комплекте с работающей системой охлаждения.
Увидев объявление о продаже нерабочей видеокарты Asus 1080 TI Turbo (≈2000р), я примерил отверстия и компоненты, вроде все сходилось, заказал.

Но к сожалению, первый блин комом. Подошли только 4 болта для прижатия процессора к радиатору и еще одно отверстие для прижатия бэкплейта. Это было очень ненадежное решение, к тому же громкое из-за наличия только одного вентилятора турбинного типа. Это меня не устроило и я отправился на дальнейшие поиски.
Подходящих вариантов из линейки 10-ой серии на Авито я не нашел, но кроме геймерских видеокарт есть майнинговые. Так я подобрал EVGA p104-100 (≈2000р) и на удивление ее система охлаждения хорошо подошла на Tesla P40 и на второй раз мне удалось по-нормальному вывести работу с вентиляторами.

Однако, все-таки пришлось подпилить трубки и сам радиатор (купил отрезные диски насадки на дрель), потому что коннектор питания выходит в бок, а не на верх как у EVGA p104-100.
Радиатор и корпус найдены, но на плате Tesla P40 нет коннектора для вентиляторов, а без обдува все это не имело бы смысла. Поэтому я:
Tesla P40
Теперь обороты вентиляторов видеокарты регулируются через реобас. Как правило, я выставляю минимальные обороты, этого хватает, чтобы отводить тепло и не издавать много шума.
Здесь я писал о первых длительных тестах ИИ в работе разных моделей.
Данные ниже актуальны на момент написания статьи (февраль 2026 года).
Видеокарту Tesla P40 я использую совместно с двумя RTX 3090 на Debian 12 c 580 драйверами, все 3 видеокарты работают под управлением llamacpp для инференса gpt-oss-120b.
Tesla P40 уже устарела и имеет compute capability 6.1 (СС), драйвера новее 580 не будут поддерживать эту карту.
Если говорить про поддержку Tesla P40 в ИИ, то llamacpp еще поддерживает эту карту, а вот vllm (СС 7.0) уже нет. В ComfyUI тоже не получится использовать, хоть документация и утверждает что нужна CUDA 13, все еще можно использовать 12 версию, но при запуске ComfyUI пишет что необходимо СС 7.0, например Tesla V100, а с Tesla P40 отказывается работать.
Цена на Авито на данную карту составляет 25000-30000 рублей, добавив еще столько же можно купить RTX 3090, которая еще актуальна и быстрее.
И немного данных о производительности в инференсе gpt-oss-20b:
Tesla P40: 60 т/сRTX 3090: 180 т/сПройдя этот нелегкий путь кастомизации системы охлаждения и адаптации серверного оборудования под домашнее, я понял что в моем случае было бы проще купить RTX 3090 и не заморачиваться. Однако, это было веселое приключение :)