按行名进行表格筛选:python&R

按行名进行表格筛选:python&R

作者: 风槿如画

引入

Excel确实很强大。
用Excel查找一行很容易,同样的事情1000次就很复杂。
批量查询的需求应运而生~
实验狗确实需要各种帮助,不然就傻傻复制啦~

1.利用python中的panda筛选

import pandas as pd 
df1 = pd.read_csv('D:/TPM.csv', encoding='gbk') #加encoding=‘gbk’是因为文件中存在中文,不加可能出现乱码
df2 = pd.read_csv('D:/ID.csv', encoding='gbk')
index = df1[u'Gene_ID'].isin(df2['gene']) #用2中的行名去筛选1中共有行名的行
outfile = df1[index]
outfile.to_csv('D:/result.csv', index=False, encoding='gbk') 

注意:
不会用python,可以直接在windows装一个Anaconda,利用win+R—jupyter notebook—New—python3—复制代码即可。

2.利用R中merge函数筛选

ID=read.csv('geneID.csv')  #file of gene IDAll_
TPM<-read.csv('All_TPM.csv')
TPM<-merge(All_TPM,ID,by='geneID') #用2中的行名去筛选1中共有行名的行
head(TPM)
write.csv(TPM,"TPM.csv")

3.参考文章

https://blog.csdn.net/destiny_python/article/details/78663460

欢迎关注微信公众号:蚂蚁生信

如若有问题,或侵犯您的版权请及时联系我,谢谢

跳至工具栏