Three Month
文章 15
標籤 11
分類 4
使用nni尋找最佳超參數

使用nni尋找最佳超參數

透過docker建立jupyter與tensorboard環境

透過docker建立jupyter與tensorboard環境

LLaMA中使用的Positional Embedding

LLaMA中使用的Positional Embedding

為什麼torch.nn.transformer中每個input的feature size需要是head數量的倍數

為什麼torch.nn.transformer中每個input的feature size需要是head數量的倍數

×