API Reference

Base.:!
Base.:&
Base.:|
NeuralAttentionlib.:$
NeuralAttentionlib.AttenMask
NeuralAttentionlib.GetIndexer
NeuralAttentionlib.alibi_position_embedding
NeuralAttentionlib.apply_mask
NeuralAttentionlib.apply_mask
NeuralAttentionlib.attention_score
NeuralAttentionlib.biased_score
NeuralAttentionlib.collapsed_size
NeuralAttentionlib.collapseddims
NeuralAttentionlib.collapseddims
NeuralAttentionlib.dot_product_score
NeuralAttentionlib.generic_grouped_query_attention
NeuralAttentionlib.generic_multihead_qkv_attention
NeuralAttentionlib.generic_qkv_attention
NeuralAttentionlib.get_sincos_position_embeddings
NeuralAttentionlib.getmask
NeuralAttentionlib.grouped_query_attention
NeuralAttentionlib.l2norm
NeuralAttentionlib.layer_norm
NeuralAttentionlib.lengths
NeuralAttentionlib.masked_score
NeuralAttentionlib.matmul
NeuralAttentionlib.merge_head
NeuralAttentionlib.mixing
NeuralAttentionlib.move_head_dim_in
NeuralAttentionlib.move_head_dim_in_perm
NeuralAttentionlib.move_head_dim_out
NeuralAttentionlib.move_head_dim_out_perm
NeuralAttentionlib.multihead_qkv_attention
NeuralAttentionlib.naive_qkv_attention
NeuralAttentionlib.noncollapsed_size
NeuralAttentionlib.normalized_score
NeuralAttentionlib.rms_layer_norm
NeuralAttentionlib.scalar_relative_position_embedding
NeuralAttentionlib.scaled_dot_product_score
NeuralAttentionlib.scaled_matmul
NeuralAttentionlib.split_head
NeuralAttentionlib.t5_bucketed_position_id
NeuralAttentionlib.t5_causal_bucketed_position_id
NeuralAttentionlib.unwrap_collapse
NeuralAttentionlib.weighted_sum_mixing
NeuralAttentionlib.with_rotary_position_embedding
NeuralAttentionlib.AbstractArrayMask
NeuralAttentionlib.AbstractAttenMask
NeuralAttentionlib.AbstractDatalessMask
NeuralAttentionlib.AbstractMask
NeuralAttentionlib.AbstractMaskOp
NeuralAttentionlib.AbstractSeqMask
NeuralAttentionlib.BandPartMask
NeuralAttentionlib.BatchedMask
NeuralAttentionlib.BiLengthMask
NeuralAttentionlib.BiSeqMask
NeuralAttentionlib.CausalGroupedQueryAttenOp
NeuralAttentionlib.CausalGroupedQueryAttenOpWithScore
NeuralAttentionlib.CausalMask
NeuralAttentionlib.CausalMultiheadQKVAttenOp
NeuralAttentionlib.CausalMultiheadQKVAttenOpWithScore
NeuralAttentionlib.CollapsedDimsArray
NeuralAttentionlib.GenericAttenMask
NeuralAttentionlib.GenericSeqMask
NeuralAttentionlib.GroupedQueryAttenOp
NeuralAttentionlib.GroupedQueryAttenOpWithScore
NeuralAttentionlib.Indexer
NeuralAttentionlib.LengthMask
NeuralAttentionlib.LocalMask
NeuralAttentionlib.MultiheadQKVAttenOp
NeuralAttentionlib.MultiheadQKVAttenOpWithScore
NeuralAttentionlib.NoMask
NeuralAttentionlib.PrefixedFunction
NeuralAttentionlib.RandomMask
NeuralAttentionlib.RepeatMask
NeuralAttentionlib.RevBiLengthMask
NeuralAttentionlib.RevLengthMask
NeuralAttentionlib.RevSymLengthMask
NeuralAttentionlib.SymLengthMask

Functional

NeuralAttentionlib.alibi_position_embedding — Function

alibi_position_embedding(mask::Union{AbstractAttenMask, Nothing}, score, args...)

Add the non-trainable ALiBi position embedding to the attention score. The ALiBi embedding varied for each head, which assuming the attention is multi-head variants. The first dimension of the batch dimension of the attention score is treated as the head dimension (If used in single head attention, the alibi value would vary across batches). mask can either be a attention mask or nothing. Usually, it is needed when there are gaps or prefix paddings in the samples.

API Reference

Functional

Mask

Matmul