[FEATURE] Current gradient accumulation only works for jnp.mean loss #268

zhuohan123 · 2021-12-16T11:15:27Z

The current gradient accumulation only works for jnp.mean loss because we always use mean reduction.
For other losses or auxiliary states, we should support other reduction types such as sum reduction and concatenation reduction.

zhuohan123 added the enhancement New feature label Dec 26, 2021

merrymercy changed the title ~~Current gradient accumulation only works for jnp.mean loss~~ [FEATURE] Current gradient accumulation only works for jnp.mean loss Mar 11, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[FEATURE] Current gradient accumulation only works for jnp.mean loss #268

[FEATURE] Current gradient accumulation only works for jnp.mean loss #268

zhuohan123 commented Dec 16, 2021 •

edited by merrymercy

Loading

[FEATURE] Current gradient accumulation only works for jnp.mean loss #268

[FEATURE] Current gradient accumulation only works for jnp.mean loss #268

Comments

zhuohan123 commented Dec 16, 2021 • edited by merrymercy Loading

zhuohan123 commented Dec 16, 2021 •

edited by merrymercy

Loading