nv-pre-compile-ops

Enabled configurable auto Tensor Parallelism (TP) for the inference of diverse models #9252

Sign in to view logs

Summary
Jobs
- unit-tests
Run details
- Usage
- Workflow file

Re-run triggered January 21, 2025 03:34

delock

#6553

gyou2021:configurable_autoTP

Status Success

Total duration 14m 55s

Artifacts –

nv-pre-compile-ops.yml

on: pull_request