diff --git a/tools/ucsc_tools/ucsc_axtchain/axtchain.xml b/tools/ucsc_tools/ucsc_axtchain/axtchain.xml index ebcf2c838fd..06a15410cb6 100644 --- a/tools/ucsc_tools/ucsc_axtchain/axtchain.xml +++ b/tools/ucsc_tools/ucsc_axtchain/axtchain.xml @@ -72,17 +72,28 @@ `axtChain`_ is a tool to chain together alignments in `axt`_ format. The `chain`_ format describes a pairwise alignment that allow gaps in both sequences simultaneously. +For implementation details see axtChain's `source code`_. -sample linearGap file (loose):: +linearGap defaults: - tablesize 11 - smallSize 111 - position 1 2 3 11 111 2111 12111 32111 72111 152111 252111 - qGap 325 360 400 450 600 1100 3600 7600 15600 31600 56600 - tGap 325 360 400 450 600 1100 3600 7600 15600 31600 56600 - bothGap 625 660 700 750 900 1400 4000 8000 16000 32000 57000 +loose:: + + tablesize 11 + smallSize 111 + position 1 2 3 11 111 2111 12111 32111 72111 152111 252111 + qGap 325 360 400 450 600 1100 3600 7600 15600 31600 56600 + tGap 325 360 400 450 600 1100 3600 7600 15600 31600 56600 + bothGap 625 660 700 750 900 1400 4000 8000 16000 32000 57000 + +medium:: + + tableSize 11 + smallSize 111 + position 1 2 3 11 111 2111 12111 32111 72111 152111 252111 + qGap 350 425 450 600 900 2900 22900 57900 117900 217900 317900 + tGap 350 425 450 600 900 2900 22900 57900 117900 217900 317900 + bothGap 750 825 850 1000 1300 3300 23300 58300 118300 218300 318300 -For implementation details see axtChain's `source code`_. .. _axtChain: http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/FOOTER.txt .. _chain: https://genome.ucsc.edu/goldenPath/help/chain.html diff --git a/tools/ucsc_tools/ucsc_axttomaf/axttomaf.xml b/tools/ucsc_tools/ucsc_axttomaf/axttomaf.xml index fffe3758e92..537e5688bc0 100644 --- a/tools/ucsc_tools/ucsc_axttomaf/axttomaf.xml +++ b/tools/ucsc_tools/ucsc_axttomaf/axttomaf.xml @@ -1,9 +1,21 @@ - + Convert dataset from axt to MAF format 469 + + + + + + + + + + + + UCSC_Genome_Browser_Utilities @@ -25,6 +37,14 @@ #else: '$query_reference_index_source.que_ref_index_file.fields.path' #end if + #if str($t_prefix) + -tPrefix='$t_prefix' + #end if + #if str($q_prefix) + -qPrefix='$q_prefix' + #end if + $score + $scoreZero '$out' ]]> @@ -60,6 +80,14 @@ + + + + + + + + @@ -77,6 +105,20 @@ + + + + + + + + + + + + + + diff --git a/tools/ucsc_tools/ucsc_axttomaf/test-data/2.axt b/tools/ucsc_tools/ucsc_axttomaf/test-data/2.axt new file mode 100644 index 00000000000..c88ac3f3ad8 --- /dev/null +++ b/tools/ucsc_tools/ucsc_axttomaf/test-data/2.axt @@ -0,0 +1,19 @@ +0 chr1 52448 53340 chr2 111209343 111210259 + 33103 +GCCAATGGATAGAGTAAATAATTCTGCGGTATCTAAATTTGTATTGATTGGACTTTCAAGCTCTTGGGAGATGCATCTTTTTCTTTTTTGGTTCTTCTCTGTGTTCTACATGGGAATTATCCTGGAAAATCTCTTCATTGTGTTCACAGTAATTATTGACTCTCATTTA-AATTCCCCAGGTACTGCCTACTGGCCAACATTTATCTTCTTGATCTGGG----TCTTCTCCTACAGT-------------TCTGACTTTTTCACTAACTGCAGCATCATTTCTTTTCCAAGATGCATCATACAGATATTTTTCATTTGTGTCATGCGTAAAAATTGAGATGGTGCTGCTCATAACCATGGCATAGAGCAGGTACACTGCCAATCTGTAAGCCTCCCCATTACCTGACCACAATGAACCCCAAAATGTGTGTTTCCTTTGT---TGGAGGCATCCTGGATAGTCAGGATAATCCATGCTGTATCTCAGTTTGTTTTTGCCATAAACTTGCCTTTTTGTGGCCCTAATAGAGTAGGTAGTTTTCACTGTGATTTTCCTTATGTCATGAAACTTGCTTGTGTAGACACTTACAAACTAGAGGTTGTAGTCACTGCTAACAGTGGGCTTATATCCATAGCTACCTGTTTCTTATTAATAATATCCTATATTTTCATTTCGGTAACCGTCTAGAATCCTTCTTCAGGAGACTTATCTAAAGCATTTGT-GTCATGTTAGATCACATCACAGTAGGGATTTTGTTTTTTATGCCATGTATATTTCTGTATGTGTAGCCTTTGCCTAAAACAACACATGATTAATATTTGTTCATTGTTCCTTTTGCTATCACCCCTG--------TCTAGGATCTACACATTAAGAAACAAAGACATGAACGTCTCCATGGAAAGACTGGGAAAATGGA +GTCAATGGATCAAATAAATGAAACTGTAGCTTTTGAATTTGTGTTGTTGGGACTCTCCAGTTCTTGGAAAAATACAATTTTTCTCATGTCCACCTTCTCTTTGCTCTATGTAAGCATCATCGTGGGAAACCTTTTCATTGTCTTTTTGGTAATTAATGACTCCCGTTTACAGTCTCCTATGTATTTTCTTTTGGCCAATCTGTCCCTCATTGATGTTGGACTTTCCTCTACCACAGTGCCCAAGATGATCTCAGATCTTCTGAAAGAGCACAAAGTAATATCTTTCCACAGTTGCATGACTCAGATCTGCTCCATCCACATTATG-GGAGGAGTGGAGATGGTGCTGCTCATAGCCATGGCGTTTGACAGGTACACGGCCA-TCTGTAAGCCTCTGCACTACATGAGCATCATGAGCCCTAGAATATGCATTTCATTTGTAATTGCTGGC----TGGGTCACTGGAGTGGTCCATGCCATGTCACAGTTCTCTTTTGTTGTGAACCTGCCTTTTTGTGGTCCTAACAAAGTGGACAGCTTTTACTGCGACTTCCCTCGAATCATACAACTGGCATGCACGGATAGAGACACATTTGAGTTTGTTGTTGCTGCCAACAGTGGCTTCATGACCTTGGGGACCTTCTTCTTGCTTCTCCTCTCCTATGTCTTCATTTTGGTCACAGTCTGGCAAAGGTCTTCAGGGGACTTGTCAAAGGCGCTTGTCACTCTGTCAGCTCACATCACTGTGGTTGTTCTGTTTTTTACTCCATGCATGTTTCTCTATGTGTGGCCTTTCCCCACATCATCGACTGACAAATACCTGTTCATTGTTGACTTTGCTGTCACCCCTGCTCTTAATCCTGTCATCTATACTTTAAGGAACAAAGATATGAAGGAAGCCATAAAAAAGCTGAGCAAGCAGA + +1 chr1 56555 58924 chr2 111303515 111305845 + 43395 +CACATTATTCTGCAGTTTTTATCTTGCTTACGTATTTTTGGAATGTTACTATTTTTCAAAAATTAATTTGGGATCAACCAACACTTCTTATTCTGCTGCTGTTCTAGAGAAAATCATTTTCCTCATTTCTGAACAAGAGAAAATGAAAT-----------------ACAGCTCTAAACAAATGCCACTGTAAACCAAGGTGGAGCCTTTGCACTTTCAGGCCACCATGATAACCT---GGAGATTAGATTTTTCTGTGTCTTTATATCAATAATAAAGCCAAGCTTCTCCAGGGGTATCCACTAGGCTTGTCTCAATGGCTCAATACAGGTCCTTTTGTGAATGATTACCTCACCCTCATGGAAACACACTCTT-GTTACAGAAACTCAGAATGATTCTATTTTTTCTTTTATATTTGTATATGTTTTTCCAATACCTCTGAAAAAACTGATCCAAAAAAAATACAAATTTTAATTGTAGCCAGTCAATTCAGGAAGGATAAAGGTCAAAAACTTTCAAAGAAACCTTCAGCCCCAACACACTAAACTTTGGGAGCACAGGTTGGCATCCAGAGGTAAACATTTGCTATAACTGATAACAGGAGAAGGATCCATTTATTCACCTGTTATCAATTACAGGCATTGTATTTAAAGATCAGATGTTTTATATTTATTTCTTCAAATTTCATTCATGGTGCCATAAGTGAAGGTATCTCTGTCCACCCTGAATATATTTTCACTCCCTCATCTCAGTCATTCCGAACAATTCACACACTAAGATTACCCATGCTAAATGGGGATTCTTTTTTACTAGCCAATGTAGTACCTCAAATCCTTCCTTCCCTCCCCCTATTTCATCAGCAGGCAATTCTTTTGATACTTTTGTCAAGGGGAAATTGTGTGACTCAGAGATCTAGTCCCCAAGAGAAACTAATAATGGGCTGGGTATTGTCTGTCTCAGCAGCATCAGTGGGTCCCTCTCCTGTGCAGCTAATTAGCTTCCTTTCCAATATGAAGAATCTTATATATAGCTTTGTCTTT-GGGGTATTAC----ATAAATGAAGATTAAGCTATCTGAATTTCTCCTTCTCCTAAAAATGCACATCCTATGACTGAAAAGACAGGTAAAAGAGATGCTTTTAATTACAAAACTTTCCCTGTCGTGGTTGCTTCTCTCTATCCTTCTAAACTCCCTTTCAATTTCTTCTCTTCTGTAACATATTTGTGCCCAAAATCTTCTGCTTTCTGAAATATTTT--ATCTTTTTCTTCCACACTATCTC----TTATTTTCCAATTTTAATCATTAAATTATATTATGTCTTATAAAACTAATCCCACATATAAACCCCTATGATA--ATTTCAGTTTG--TCCCTAGTATGAAG-TTCTTTAAAGATGTGTAGTTTTCTAACTTTCATGCTCTCCAATTAATTATAAACTTCATTTTCCACTCTGAAAAGGAGATGTCTGATCTCAGCTATTTCCATCCTATTTGAAAACCAGATTTAGTTTTAAACCAGAGGAAGGGAATCTCAAGTCTTTACCTCCCACAGTCTGGTGTGATTCTCTCTCTTTTGGTATTACCTTCCTCCACATTGGAACACTCCAGCCAATGCATAGGCTGAGAGGCTATCTC-AGATTCAGAAAGATTTGGCCTCATCCCAGGGGAGGGTACAGAGGAGCTGATGACTATGAATTC--TGAAATGGAACTGTTCCAG-------------GTTGAAGAAATAAGAAAGGGAATTGGGAAGAGCAAT-----GCCCAGTGAAAAAGAAGAAATAA-TATTTTAGGAAGT-GAATGC-TAATTTTATTTTAAACAAAATAAGAACTCAAGGAATAAGAGGGTTCTTCCAATAGGTTAGAGTGATCCTGTCAAACATATATGCTTCT-AGATTTTTTTAAAGACTGTTTCTACTAAGAAAGCATAGACCGCTATTGAGAAAGATCATTAAACTGGAATTTAGGAGGTCTGCCTTCTGATTCTGACTTCTTGAATGTATTGTTAGCCAT----TTAACCACACTGTGTTGTTTC--------TCA--TTCTACCTGTAGAATCTCAAAGTTCTTTCCCACTTCTATACAAAACTATAATTCTGAACATCCTTTTTGTTTAATATAAGTCTGCATTTCCTGTTTGAA--GATATGTGTCCC-AGACCCTAAATGACTGACAAATTTTAAATCTCC---AATAGGAAAGATGACAAACTCTATGGAAACTTGGCTTCTGAAGAACTCCTAGAAGCTTTCCAAAGTCATCAGTGTTTCCTAAGAAGGCAGAGAAATCAAACAC-----------------------------------ATGG----------------------------TCTTTTCCTCCAGACAAGCTCCTTTGGGTCATCAGGATTTCTTCAACAATA---AAATGTAATAATTCCAAATGTTTGTAACAGAATGGGTAGGACTTTCTTCACTTATTTAAATACTCCCTTTTT +cacattgtattgta--ctctattatgttt-tattgtattatattatTGTTGTTTTTCAAAAATT----TTGGTTAAACTAGCATCCCTTCTTTTTCTGTTGACCTAAGAAGAAACCCTTTCCTTCTTT-TGAACAAGATAAAATGAAGTGCAGATTTCTAAACAACACAGCTTTAAAGAAGCACACTTATAAACAAAGGTAGAGCTTTCACTGTTTCA-------ATGA-AACCTCAGTGAGATCAGATT-----ATGACTCTACATAAATGACAAAG------------------ACCCACCGAGACTGGTACCATGTTTTCATTCATATGGTGTTA--AATGATGGTCTC---CTCGGGTATCCAGACCCTTCATTTAAGTAACTCAAAACAACT----------------ATCTATAT-----CTTCCAAAATTTCTAAACAAATTGACCCGATGACT-TACAAGTTTAACTTATAATAGATCAACTCA--AATGATAAAA--TAGTGATTTTCAGATATACCTATATCCTCTGG---------TTTTGTAGAGCATTCAGGCTTTCTTGGACAAACATTTGTCA-AAATGA-AACAATAAGAACTTTTATCTTTTTCCATACTAACAAGTGAAG----TGTATTTTCAGATAATTAGTTTTAGACT-ATTTTT---AATTTGATATATGAATCCA-GAGTAAAAATACAGCTATCCACTTTTGGAATATTTTTTATTCT-----------ATTTCAAGCAATTCATAAAAAAAGATTATAACTCCTCAA-GGAGGTTATTTTAAATT---TAATACATTACACAGAATATTTTTATTTTTTCCCTT-TTATATAACCAGACAATTCTTTTGATACTTCTCTCTTGGGGAAACCA-ACAGCTCAT-GATCCAATTCCCAATAGAAACTATTAATGAACTGGGTATTGGACACCTTCACAGTGCCAATGGGTCACTCTCCTGAGCAAATAATTGGCTTCTTTGCCACTATAAACAGTCATACATATATCTTTGTCTTCAGGGGCATTGCTTATAGAAATGAATGATAACCTACTTAAATTT-TCTTTTTCTTCAAAGCGTACCTGCTGTTACTTTAGAGA-AGGT--AAGGGGTGGTTTACATTTAAAACCTG--CCGATTATAGTTG----TTTCAATCTTGCTAA------CTCTAAT---CTCCCATCTGTAAAATAATTATGTCAGACAT-GTCACCTTTCAAGAGTATTTTTACCCTTTTAATTTTAAACTATCACAGAATCGTTTTGTGATTTTATTTA--AAAATAT----TGCTTTATATAATTAATCTCGTGCTCACAACCTTTTGATATTTTTTTAATTTGCTTCTTTGGTATGAAGATTTTTCAAGAACGTGTG--TTTCTGCTTTTTGTAGCCCTCAGACAATTGTGCAATTCATTTCCAACTATGCCAAGCAGATGTCTGGTCTCAGATATTTCCTGCATA-TTAAAGATCATATTACAATCTCAAT-----------AATCTCAAGCCTTGTCTGCCAATACTCTGGAGTAATTCTTACCTTT----TATT-------TCAATATTTGAATACTGTAAGCAGTGAATACACTGAGAGACTATTCCAAGACTTAGATATATT-----CTAGCCCACAGGATTCTAAAAAAGTGC-ATTAAATAGAAATTCTTTTTATTGCAACTGTTCAAGTAGTGGTCTAGATGTTTGAAAAA-AAGAAAAAAAATTGGCAAAGTCTATTAAGGGCACAGGGTAGGGAAAGGACTAGTTTTTTTACGAAGTAGGATGTGTAGTTTTATGCCAAACTGAGTATGAGTTCAAAGACTAACACAATCCTTTCAGTAAAGCAAAGTGATCATATCAAATATATAGTATTCTGAGATTTT----ACAACTGTTTCTCCTAATCATTTGTAGAGTAATACTGACGAA---CAGTACACTAGAGTTTAGGACACCTACCCTCTGA-TCTGTAGTTCTGTATGTTTTGCTCTTGATGCTGTTAA--ACACTAGGCTGTTTTATGCAGAATCAAGTGTTAAATGCGTTTTCTCACAGTTGTTCCCAGTTTTCATGTAAATCTACGATTCCATTAGTATGCTTTGTTTAACACATGTCTATGTATCTTGTTTGAAGTGATACTTATCCCTAGACCTTGAATAATAGACAAATTTTAAGTCACCACAACCAGGAAAACCATCAAACACTATGGGGACTTGGTTTCTGATGCACTCCTTGAAGCTCCATGCTGTTATCAACAGCTCT---GAAGGGAAAGGAATAAAGCACTATattttgcttttgttttgattttatattttgaGATGGAGCTGAGAAGTTGTTTTGTTGTATTTTTACTATTTTTACACATAAATTCTCTAGAAACATGTGGATTtaat-aataatatataaaaataataaCCCAAAATGCTTGTAA-------GATAAAAAGACCTTCATTTATTTAAGTTCTCATTCTTT + +2 chr1 60917 61125 chr2 111306441 111306644 + 8501 +TTAATATTTCCCACTTCATCATTACTAACCTCACTCACTCTGAACTTGATGAGAGCACCTGAGCATTAATTTTTCTTATAATTATTTAATGATTACCAGAATTCGTTCAGTATGGCCAGCTCTGGTCAAAGTGAGGCAGGCAAGATGCTTTGTCAACTGCCTGGATGGAATGTCTCAAAAGGTTTCCATTTCATGGTAGCATTATGCAA +ttAATAT--CCCAGTGCACC-TCACTACTCTGGCTCACGCTGAGCCTGATGAGGTCATA-GGGCATCCATTTTTCTTGTAGTTATTTTATTATTACCAGAATTCATTCAGAATGGCCACCTCTAGTCAACACAAAATAAGCAGCGTGCTTTGTC-ACTATTTGAGTAGACTTCCTTAGGAAGTTTTCATCTTAGGGTAGTTTTACATAA + +3 chr1 61126 61836 chr2 111307411 111308031 + 9500 +AGTTCAAGACGTTTAATCAAGACCCTTCACTTACTTAACTATACCTCCTTGAGA-ATCCCATCTATGAAAAAATTCTAGTCATTATAAAAATGATTGATTAAATGAGGGAAGTAGTAGAGTTCTTCATTTCTTTAGTTGGTTTAGTCTCCTATGAGTCAATCCTA-TTTTCAAA-ATTCTTAATAAACCATTTATTCCTTCAACTTTCTATGCCATTTGATGTTTTGTAAAAAAAAAAATATAA------TATGTATACAAAAAGATATTTCAAAATCTAGAAAGAGAGCTTTAGAGCTTTGTAAAGCTCTTTTAAAAATCAAAAACAACTACTGTTAATTAACATGTTGTACTATGC-AATTTGTTTACCATTATTACTCTTGGTATTTTTAAGAAAAGTCTT----TCCATTGTTATTATAAATGCTTCTATTGATATTTATTTTAATAACTGTTATTACAGTCCGTCATGTACATACACTATACTTAAAcctaatgtttggtatttaaatcgtttcaagattttatc----actgtcaacaaagtatgatgaatattttta--tgctgaaaacttctgtaaaaatagaattccaagagtattattgcaccaaaaggcatggacttaaaattcttgatacatgatttcaaaatattttctttaaggtttgaatcagtctatattccctccagcagcgtataaaagtgccaatttctctgatccttagcc +aGCCCAAGAAAATTAAACAAATCCCTTTACTAATTTAAATGTATCTTGCTACTAGATATCATTTGTGA---------------CATAAATATTTGCAATAAAAT--------CACTAACATTATTTATTTCATCAGTG-------------ATGGGTTAACCCTAGTTTTCAAACAGCTTTGATAAATCTGTCATCTCTTTAGATCACTAGATAATTTGATATTTGAGGGGAAAATAGATATGAATGCACTATGTGCATTAAAATATCCCTTAAA-TCTAAAAATAGAA-TTAGAAGCTCTG------------AAACCTGAAATGCTATCATTGTAACCGGGAATGATGGGATATGCTAATTACTTTACAACAAT----------GTTTTAAGCAAGAATCTTAAAGTCCA------------------------ACATCTAGTTT------TGTTATTATAGCCAACTGTGTATATTTGATATATTTATACCTAATTGCTTTCATTTAAACTGCCTTAAAGCTTTACTTAAAACTATCAATAAAGTCTTGCTAGTATTTGTGACTGGAGATATTATCTGTACAAGTAGTTATTTCAGAGAAGTACTTTACAACAAGGTATGGAGATAAAATTATTGACATAT---------------TGTTTAAGGGTTAAA-----ATATCTTCCCTCTTGTGAATTATAAATAAACCAATTTCATTGAGCTTTTGCT + +4 chr1 61944 64435 chr2 111308032 111310602 + 69061 +ctccgcctcccggggtcaagctattctcctgcctcagcctcccaagtagctgggactacaggcatgcaccaccatgcccagctaatttttgttatttttagtagagatggagtttccccatgttggacaggatggtctcgatctcttgacctcgtgatccaccctcctcggcctcccaaagtgctgggataacaggcgtgaacaaccatgcccggcctgtaaaactttttcctaatttaacagaaaaataatagtattatattttatcatatttctttgatttctaAGacacacatacacacaca---cacacacatatctgtatatacaaatacacgtatagc---------------------------------------------ttacaTTTT--AATTCTTCATTTCATTTGTTCATTTATTAGGTCTTGGAGATTTTGTGAAAC---------TGTTTAAATTCTTTTTTATACTATGAAGATATCAACCTT-TTGTCTCTACAGCATTTCAAATTCAAGTATGAT----TCACGTGTTGGTTTGGGGTAGATCATTATAGGCACATGTAGGAAACAGCTTT-----------------------------------------------------------------------CAGAGA----------------TGC----------CTTAACCGT-----------------------------------AATTATGCATTTGTATTC--------------TAATTTTTATTTAATGTTATTATT----GATTGCATTTTTAAAG--ATTCTGT--ATTTTTTAAACCATTTATTTGTATATGTTGGTATACAATCTTGCCATTTTCTGGGATTTCATATTTCCTTATTTTTGTTTTT--TACCTTTTTTGGCTTGAATT---TTTTGAGTTTTTATGCATTCTTTTCCAGTTTCTTAAGATGCTAATAAGTTCATGTATTTGAGCAATTGAGAACATTTAAAGCAATAGACTGCCTCTGAGCACAGCTTTGTCCATATTACATTAACCTTTTATACCCTGGGTTCCCACTAGTTTTTAAATAATCTACTATCAAATAAAAG-ATTTGTTAATAATAA-------------------------------------------------------ATTTTAAATCATTAACACTTAACGCATTATTTTCAGTCACACTAAGTTGATTCCTTCGTTTCTTTCAGGTTGCTTCAGAGTCTTCCCTTCTATCTGATTCAGTGGACCAAGTAAATGACTCTCTGGTAACAGAATTTGTATTACTTGGACTTGCACAATCCTTGGAAATGCAGTTTTTCCTTTTTCTCTTCTTCTCTTTATTCTATGTGGGAATTATCCTGGGAAAACTCTTCATTGTGTTCACAGTGATCTTTGATCCTCACTTACACTCCCCCATGTATATTCTGCTGGCCAACCTATCGCTCATTGACTTGAGCCTTTCATCTACCACAGTTCCTAGGTTGATCTACGATCTTTTTACTGATTGTAAAGTTATTTCCTTCCATAATTGCATGATACAAAAGTTCTTTATCCATGTTATGGGAGGAGTTGAAATGGTGCTGCTGATAGTCATGGCATATGATAGGTACACTGCGATCTGCAAGCCTCTCCACTATCCAACTATTATGAATCCCAAAATGTGCATGTTTTTGGTAGCAGCAGCTTGGGTCATTGGGGTGATTCATGCTATGTCTCAGTTTGTTTTTGTCATAAATTTACCCTTCTGTGGCCCTAATAATGTGGGGAGCTTTTATTGTGATTTTCCTCGGGTTATTAAACTTGCATGCATGGACACTTATGGGCTAGAATTTGTGGTCACTGCCAACAGTGGATTCATATCGATGGGCACCTTCTTTTTCTTAATTGTATCATACATTTTTATTCTGGTCACTGTCCAACGACATTCCTCAAATGATTTATCCAAAGCATTCTTCACTTCGTCGGCTCACATCACCGTAGTGGTTTTGTTTTTTGCTCCATGCATGTTTCTCTACGTGTGGCCTTTCCCTACTAAGTCATTGGATAAATTTTTTGCCATCATGAACTTTGTTGTCACCCCTGTCGTAAATCCTGCCATCTATACTTTAAGGAACAAAGATATGAAGTTTGCAATGAGAAGGCTGAATCAACATATTTTAAATTCTATGGAGACGACATAACACATTTGGTTGATGAGAGCACAGGATAAATGCCATGGACCATCAAGACTCCTGTGATCACCATGATCACTATGGAACGCGCACATTTTTAGTATTGCCTGAAAAAACTGAAAAATCTGCAAAAAGGATGCATTAAATCTAAGAATTGTATTTCAGATAAAGTTGCAACATTTTTTGTTAATCATA----AAAAGTA-----------------------------------------TATATTTCTATCT--------AATGTGTGTATCTAATTAA-----------CAGCAATGACTAC-------------CTTT----------------AATTTTGATGTAGTTAT-TTTATATCTGTATATAAGCACATACACATATATATGACCTAGGTTTATTTATCAGTATTTTTATGCTGATAATAAGCATCACTGGAAATTAAT-----TTTCTTATGGAAATTATGTGGATCCAATGGATAAAATATGAGTTTATATAAATTAGTAAATGCCAAAATCAAGGAAGAAACAATTTTTATTTTAATTGTACTTTAAGTTAGATAAATGGTAAGGTCAACAGCTTGTTACAACCCTTAAGTATTATTTTCAGGCTGATTGTCAATATGTTTTGTACAatgttctcac +CTCTGCTTTGTGTGGAGAAG-TATTGTCC--------ACTCTGAATGATTTGGTAATA-------ATAATAATATATTTTGCTAATT--------------------------------ATATT---------------------------------------------------------------------------------------------TGTAA----TTTTTCTTATTTAACA-AGAAATGAGA-------ATTTTCTTATATTTCACTGATTTCTAacacacacacatatacacatcacatacacacaaagagagagacagagacacagagagacacagagagacagacagacagacagacagacagacagatacacagtcaCATTTCTCAATTCTCTATATCATT-GTTCACTT----TGCCTGATGGGTTTTTAGTAGCAATCATGTATATTTTAAT-CATTTTAATATTATAAAGATATCAGCTTTATTCTCTCTA-AACATTG-AAATTCAAGTACAAGATAAGCATGAGTTAGTTTTGTG---------ACAAGCATGTGTAAGAAATAATTCTTtctctctctctctctctctctctctctctctctctctctctctctccatttttctttctttctttTGGTACAGAGGATGAAAGTTCCACATGTGCTCTTAAAGCACTTTATCATTGAGTCTATTTTTTCAGTTGGCATAAGTAAAAATAAGTTAAGTGTTTTGACTCACCATTCTAATGCTTGATATTCACTTAATTTTATTAGTTTTAAATTTCAGTTTTAAAATAATTTTTTTAAGTTTTGAAAACAAT-----GTTAATGTCCTTACAGAGTCTTTTCATTTTCTGGACTACTGCATTCATTTAGGATTGTTCCCAATATCTCTTTTTATTTCACCTGCACTTGAGAATTTAATACATTTTATCCTACTACAT--AAATCGTGTCATGTTTATGT-TTTTATCAATTGCTATAATTTAATGCAGTATATCAT-TCTGAGTAGAGCTTTTTTCAAACTCCATAAATCTTATATACACTGGATTCCTCACATTTTGTAAATTGTCTAC-ACCAATTAAAAATACTTGTTAATAGAAATTGTTTTGATAAACAAATTGTCTAGTGTTAAACAATATCTCTGGTACAGTGACTGATTTTAAATGACTAACATTTAAT--CTTACTTT--GATGCCTTAAAATAATTCAT-CTTGTCTTTCAGGATTTTTATGTATTTTCCCAACTTTCTGATCCAATGGACCAAGTTAATGCTTCTGCTCTACCTGAATTTGTTTTGCTGGGACTTGCACAATCGTTTGGAACACAGATTTTCTTTGGCCTCTTCTTCTCCTTATTTTATGTGGGGATTCTTTTTGGAAACCTCTTCATTGTGTTCATAGTGATTGTTGATTCTCATTTACACTTCCCCATGTATATTCTATTGGCCAACCTTTCGCTCATTGACTTGGGCCTTTCATCTACAACAATTCCTAGGACAATATCTGATCTTTTTACTGGCTGTAAAGTCATTTCTTTCCACAGCTGCATGACACAAATGTTCTTCATTCATGTGATGGGTGGAGTTGAGATGGTACTGCTCATAGCCATGGCATATGACAGATATATAGCAATCTGCAAGCCTCTTCACTACCTGATGATCATGAATCCCAAAAAATGTATAATTTTGGTAATAGCAGCTTGGGTCATAGGGATGATTCATGCAGTGTCTCAGTTTCTGTTTGTTGTAAATTTACCCTTCTGTGGTCCCTACAATGTAGGAAGTTTTTATTGTGATTTTCCAAGGGTCATTAAACTTGCATGCATGGACACTTATAAACTAGAATTTGTGGTCTCTGCCAACAGTGGCTTTATTTCTATGTGTACCTTCTTTTTTCTGATTACATCATACATTTTTATCCTGGCCAGTGTACGACAACATTCTTCAACTGATTTATCCAAAGCATTTGTCACCTTGTCAGCTCACATCACTGTAGTGGTTTTGTTTTTCATACCATGCATGTTTCTGTATGTATGGCCATTTCCGACCAAGTCACTTGATAATTTCTTTGCTATTGTTGACTTTGTTCTCACTCCTGTCTTAAATCCTACTATCTATACTTTAAGGAATAAAGATATGAGGTTGGCCATCAGAAGGCTAAGTAGACAGGTTTTAAGTTCTAGGGAATTTATATAGTAAATTTTATTAGTATCAACACTGA--AAATGTGATAAACTATCAA---------------TATTAACACTATAGAATAAAAACATTATT-TTATTGGGTTTAGAAACATAAGAATGTAC--------------CTATCAAAGAGTTTCAATTAATAAGGAGTTACAATAACTTCTGCTGGTTACAAAATAAAAGTGTTATATGTTTTCAAATCAACATAACTAAATCTTGTTGGTTTTATATTTTTGTATTGAATTGAAGTATTCATATTTATTTAAGTTATTATAACCAGCAATTATTGCACAAATGTTCATGCTTTTTGGTTTGTATAAATAAATGTGCatatatatatatatatatatatatatatatatatatatatatatataAAATGAACC--TTTATCAGCATCTATATGCAGATAATA--CAACACTGGTTACTAATATATATTTCTTGTGGAAATTATGTGGATCCAATGGATAAA-----GGTTTATGTAAACCAATA------------------------------ATTTTAA------TTTAAGACTTATAAGTAGGA------------------------TAACCATCACTATTAAGAT-------------TTTTGTGTCCTTCTCTTAC diff --git a/tools/ucsc_tools/ucsc_axttomaf/test-data/hg38.noprefix.fasta.fai b/tools/ucsc_tools/ucsc_axttomaf/test-data/hg38.noprefix.fasta.fai new file mode 100644 index 00000000000..4c4cc48d41f --- /dev/null +++ b/tools/ucsc_tools/ucsc_axttomaf/test-data/hg38.noprefix.fasta.fai @@ -0,0 +1,24 @@ +chr1 248956422 11 50 51 +chr2 242193529 253935573 50 51 +chr3 198295559 500972984 50 51 +chr4 190214555 703234466 50 51 +chr5 181538259 897253324 50 51 +chr6 170805979 1082422360 50 51 +chr7 159345973 1256644470 50 51 +chr8 145138636 1419177374 50 51 +chr9 138394717 1567218794 50 51 +chr10 133797422 1708381418 50 51 +chr11 135086622 1844854801 50 51 +chr12 133275309 1982643168 50 51 +chr13 114364328 2118583996 50 51 +chr14 107043718 2235235623 50 51 +chr15 101991189 2344420228 50 51 +chr16 90338345 2448451253 50 51 +chr17 83257441 2540596377 50 51 +chr18 80373285 2625518979 50 51 +chr19 58617616 2707499742 50 51 +chr20 64444167 2767289723 50 51 +chr21 46709983 2833022786 50 51 +chr22 50818468 2880666981 50 51 +chrX 156040895 2932501830 50 51 +chrY 57227415 3091663554 50 51 diff --git a/tools/ucsc_tools/ucsc_axttomaf/test-data/mm39.noprefix.fasta.fai b/tools/ucsc_tools/ucsc_axttomaf/test-data/mm39.noprefix.fasta.fai new file mode 100644 index 00000000000..16f76b03e24 --- /dev/null +++ b/tools/ucsc_tools/ucsc_axttomaf/test-data/mm39.noprefix.fasta.fai @@ -0,0 +1,21 @@ +chr1 195154279 11 50 51 +chr10 130530862 199057388 50 51 +chr11 121973369 332198880 50 51 +chr12 120092757 456611729 50 51 +chr13 120883175 579106354 50 51 +chr14 125139656 702407205 50 51 +chr15 104073951 830049667 50 51 +chr16 98008968 936205110 50 51 +chr17 95294699 1036174270 50 51 +chr18 90720763 1133374875 50 51 +chr19 61420004 1225910066 50 51 +chr2 181755017 1288558482 50 51 +chr3 159745316 1473948611 50 51 +chr4 156860686 1636888845 50 51 +chr5 151758149 1796886756 50 51 +chr6 149588044 1951680079 50 51 +chr7 144995196 2104259895 50 51 +chr8 130127694 2252155006 50 51 +chr9 124359700 2384885265 50 51 +chrX 169476592 2511732170 50 51 +chrY 91455967 2684598305 50 51