RoCoFT

This is the implementation for the paper "RoCoFT: Efficient Finetuning of Large Language Models with Row-Column Updates".

[Paper] [Code]

🙋 Please let us know if you find out a mistake or have any suggestions!

🌟 If you find this resource helpful, please consider to star this repository and cite our research:

@article{kowsher2024rocoft,
  title={RoCoFT: Efficient Finetuning of Large Language Models with Row-Column Updates},
  author={Kowsher, Md and Esmaeilbeig, Tara and Yu, Chun-Nam and Soltanalian, Mojtaba and Yousefi, Niloofar},
  journal={arXiv preprint arXiv:2410.10075},
  year={2024}
}

Introduction

RoCoFT is a parameter-efficient fine-tuning (PEFT) method designed to optimize task-specific performance while drastically reducing computational overhead by training selective rows and columns from pre-trained weight matrix

Requirements

Use python 3.11 from MiniConda

torch==2.3.0
accelerate==0.33.0
einops==0.7.0
matplotlib==3.7.0
numpy==1.23.5
pandas==1.5.3
scikit_learn==1.2.2
scipy==1.12.0
tqdm==4.65.0
peft==0.12.0
transformers==4.44.0
deepspeed==0.15.1
sentencepiece==0.2.0

To install all dependencies:

pip install -r requirements.txt

Datasets

You can access the datasets from hugginface

Quick Demos

To get started with RoCoFT, follow these simple steps:

Import the necessary modules:

import RoCoFT
from transformers import RobertaForSequenceClassification

Load a pre-trained model and apply PEFT:

model = RobertaForSequenceClassification.from_pretrained('model_name')
RoCoFT.PEFT(model, method='row', rank=1)

For column

RoCoFT.PEFT(model, method='column', rank=1)

In order to choose row or column using pruning technique

import RoCoFT

# Example text input
input_text = tokenized_datasets['train']['sentence'][0:200]

input_text = []
for i in tqdm(range(len(tokenized_datasets['train']['premise'][0:200]))):
    st = tokenized_datasets['train']['premise'][i] + tokenized_datasets['train']['hypothesis'][i]
    input_text.append(st)
   
input_ids = tokenizer(input_text, return_tensors='pt', padding=True, truncation=True)['input_ids']


# Get the embedding of the input text
with torch.no_grad():
    embeddings = model.roberta.embeddings(input_ids)

RoCoFT.PEFT_prunig(model, method='column', rank=3, input_data=embeddings, descending=False)

If descending=True, pruning method return the least weights.

🚩 Note: In the examples or notebook, we have used leader , feel free to replace it with RoCoFT

Name		Name	Last commit message	Last commit date
Latest commit History 140 Commits
Commonsense_Reasoning		Commonsense_Reasoning
Datasets		Datasets
Lora		Lora
Math_Reasoning		Math_Reasoning
column_leader		column_leader
figures		figures
random_leader		random_leader
row_leader		row_leader
(KernelRegression)ntk_laziness.py		(KernelRegression)ntk_laziness.py
NTK.ipynb		NTK.ipynb
README.md		README.md
RoCoFT.py		RoCoFT.py
example_4row_sst2.ipynb		example_4row_sst2.ipynb
example_cola.ipynb		example_cola.ipynb
lazy.ipynb		lazy.ipynb
leader.py		leader.py
leader_old.py		leader_old.py
mrpc.ipynb		mrpc.ipynb
ntk_laziness.py		ntk_laziness.py
prune.py		prune.py
prune_example.ipynb		prune_example.ipynb
prune_old.py		prune_old.py
requirements.txt		requirements.txt
result_col_subset.tar.gz		result_col_subset.tar.gz
result_ft_subset.tar.gz		result_ft_subset.tar.gz
result_ft_subset2.tar.gz		result_ft_subset2.tar.gz
result_row_subset.tar.gz		result_row_subset.tar.gz
rocoft.png		rocoft.png
xor_simulation2.py		xor_simulation2.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RoCoFT

Introduction

Requirements

Datasets

Quick Demos

About

Releases

Packages

Contributors 3

Languages

Kowsher/RoCoFT

Folders and files

Latest commit

History

Repository files navigation

RoCoFT

Introduction

Requirements

Datasets

Quick Demos

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages