自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Keep Learning

学习Spark、CarbonData 、Alluxio等,且为其Contributor,Github为:https://github.com/xubo245。欢迎微信联系601450868!...

原创 基因数据处理70之Picard安装没成功

1.下载:https://github.com/broadinstitute/picard.git 2.安装:hadoop@Master:~/xubo/tools/picard$ ant clone-htsjdk Buildfile: /home/hadoop/xubo/tools/picard/...

2016-06-07 20:37:26 3879 0

原创 基因数据处理52之cs-bwamem集群版运行(1千万条100bp的reads)

1.art生成模拟序列: art_illumina -ss HS20 -i GRCH38BWAindex/GRCH38chr1L3556522.fna -l 100 -c 10000000 -o g38L100c10000000Nhs20 2.上传到hdfs,制定partition数spark-s...

2016-06-03 16:29:02 1015 0

原创 基因数据处理51之cs-bwamem集群版运行*

将master的local改为集群就可以了。集群运行结果: 问题: 匹配50条的时候,bwa和snap都是生成50条。但是cs-bwamem会生成492条,其中25和50条重读的很多,匹配位置不同。不知道为啥?记录:D:\1win7\java\jdk\bin\java -Didea.launc...

2016-06-03 14:21:19 625 0

原创 基因数据处理50之cs-bwamem、bwa、snap、bwa-mem与art比较

直接看结果:hadoop@Master:~/cloud/adam/xubo/data/GRCH38Sub/cs-bwamem$ cat G38L100c50Nhs20.aln ##ART_Illumina read_length 100 @CM art_illumina -ss HS20 -i...

2016-06-03 13:58:48 2615 0

原创 基因数据处理49之cloud-scale-bwamem运行成功

1.先使用art生成数据: 请看前一篇2.上传fastq到hdfs:hadoop@Master:~/cloud/adam/xubo/data/GRCH38Sub/cs-bwamem$ spark-submit --class cs.ucla.edu.bwaspark.BWAMEMSpark -...

2016-06-03 12:52:10 1154 0

原创 基因数据处理48之ART使用实例

相关参数请见上一篇1.使用实例1: hadoop@Master:~/cloud/adam/xubo/data/GRCH38Sub/cs-bwamem$ art_illumina -ss HS20 -i GRCH38chr1L3556522.fna -l 100 -f 20 -o G38L100F2...

2016-06-03 10:19:23 1252 0

原创 基因数据处理47之ART基因序列数据生成器(仿真)

1.概念: ART基因序列数据生成器 详细请见论文:【1】 和官网【2】2.下载: ART-bin-GreatSmokyMountains-04.17.16-Linux64.tgzhttp://www.niehs.nih.gov/research/resources/assets/docs...

2016-06-02 23:12:15 1704 0

原创 基因数据处理46之cloud-scale-bwamem安装(compile.pl安装没问题)

版本:https://github.com/ytchen0323/cloud-scale-bwamem/releases/tag/v0.2.11.需要设置spark路径: <!--<systemPath>/cluster/spark/spark-1.3.1-...

2016-06-02 19:00:42 704 0

原创 基因数据处理45之cloud-scale-bwamem安装(compile.pl安装有问题)

先把jar包导到制定文件夹:hadoop@Master:~/xubo/tools/cloud-scale-bwamem/src/main/alphadata$ sudo mkdir -p /curr/pengwei/github/cloud-scale-bwamem/target/ [sudo] ...

2016-06-02 10:19:10 638 0

原创 基因数据处理44之cloud-scale-bwamem安装

cloud-scale-bwamem是在spark等云环境上实现bwa-mem算法,加速对全基因组匹配的处理 1.下载:git clone https://github.com/ytchen0323/cloud-scale-bwamem.git2.编译:mvn clean package3.编...

2016-06-02 09:37:57 897 0

提示
确定要删除当前文章?
取消 删除