Məlumat

VCF məlumat sahəsində boru simvolunun istifadəsi

VCF məlumat sahəsində boru simvolunun istifadəsi


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

ClinVar ilə VCF faylımı şərh edərkən, mən aşağıdakı dəyəri qeyd etdimCLNSIGsahə (yəni, klinik əhəmiyyəti):

CLNSIG=2|2|2|2|2|2|2

Bu, əslində bu misalda bildirilir, ona görə də hesab edirəm ki, borunun istifadəsi bu cür genomik şərhlər üçün olduqca yaygındır.

Borunun istifadəsi hansıdır (|) xarakter? Mən onu VCF fayl formatının spesifikasiyasında axtardım; lakin yalnız vergülün mənası (,) müəyyən edilir (yəni, həmin sahə üçün çoxlu alternativ dəyərin olması). Bunun əvəzinə borunun nəyi təmsil etdiyini düşünürəm.

Çox sağ ol.


Getfasta¶

bedtools getfasta BED/GFF/VCF faylında müəyyən edilmiş intervalların hər biri üçün FASTA faylından ardıcıllıqları çıxarır.

1. Giriş FASTA faylındakı başlıqlar olmalıdır tam olaraq BED faylındakı xromosom sütununu uyğunlaşdırın.

2. FASTA çıxışının sətir genişliyini təyin etmək üçün UNIX fold əmrindən istifadə edə bilərsiniz. Məsələn, fold -w 60 asan baxmaq üçün FASTA faylının hər sətirində ən çox 60 nukleotidə malik olacaq.

3. Tək regionu ehtiva edən BED faylları sətrin sonunda yeni sətir simvolu tələb edir, əks halda boş çıxış faylı yaranır.


ƏMRƏLƏR

Hər bir əmrin, məsələn, istifadə edərək baxıla bilən öz man səhifəsi var. man samtools-view və ya yaxınlarda GNU-dan istifadə edən adamla man samtools görünüşü. Aşağıda sintaksis və alt əmr təsvirinin qısa xülasəsi var.

Bütün alt əmrlər üçün ümumi olan seçimlər aşağıda QLOBAL ƏMƏR SEÇİMLƏRİ bölməsində sənədləşdirilmişdir.

Seçimlər və ya bölgələr göstərilmədən, göstərilən giriş uyğunlaşdırma faylında (SAM, BAM və ya CRAM formatında) bütün düzülmələri SAM formatında standart çıxışa çap edir (defolt olaraq başlıq olmadan).

Çıxışı yalnız müəyyən edilmiş bölgə(lər)lə üst-üstə düşən hizalanmalarla məhdudlaşdırmaq üçün giriş faylının adından sonra bir və ya bir neçə boşluqla ayrılmış region spesifikasiyasını təyin edə bilərsiniz. Region spesifikasiyalarının istifadəsi koordinata görə çeşidlənmiş və indeksləşdirilmiş giriş faylı tələb edir.

Çıxış formatını SAM-dan BAM-a və ya CRAM-a dəyişdirmək üçün seçimlər mövcuddur, buna görə də bu əmr həm də fayl formatını çevirmə proqramı kimi çıxış edir.

samtools tview [-səh chr:pos] [-s STR] [-d göstərin] <in.sorted.bam> [ref.fasta]

Mətnin uyğunlaşdırılmasına baxıcı (ncurses kitabxanasına əsaslanır). İzləyicidə `?' düyməsini basın. yardım üçün və eyni istinad ardıcıllığına baxarkən `chr10:10,000,000' və ya `=10,000,000' kimi formatda regiondan düzülmənin başlanğıcını yoxlamaq üçün `g` düyməsini basın.

Daxiletmə fayllarının bütöv göründüyünü tez yoxlayın. Faylın əvvəlində ən azı bir hədəf ardıcıllığı olan etibarlı başlığın (bütün formatlar) olduğunu yoxlayır və sonra faylın sonuna qədər axtarır və faylın sonunun (EOF) mövcud və toxunulmaz olduğunu yoxlayır (yalnız BAM).

Faylın ortasındakı məlumatlar oxunmur, çünki bu, daha çox vaxt aparacaq, ona görə də nəzərə alın ki, bu əmr daxili korrupsiyanı aşkar etməyəcək, lakin onlar üzərində daha intensiv tapşırıqları yerinə yetirməzdən əvvəl faylların kəsilmədiyini yoxlamaq üçün faydalıdır.

Hər hansı bir giriş faylının etibarlı başlığı yoxdursa və ya EOF bloku yoxdursa, bu əmr sıfırdan fərqli çıxış kodu ilə çıxacaq. Əks halda o, uğurla çıxacaq (sıfır çıxış kodu ilə).

samtools indeksi [-e.ə] [-m INT] aln.sam.gz|aln.bam|aln.cram [out.index]

Sürətli təsadüfi giriş üçün koordinat üzrə çeşidlənmiş SAM, BAM və ya CRAM faylını indeksləyin. SAM üçün qeyd edin, bu, yalnız fayl əvvəlcə BGZF sıxılmış olduqda işləyir.

Bu indeks lazım olduqda bölgə arqumentlər məhdudlaşdırmaq üçün istifadə olunur samtools görünüşü və xüsusi maraq bölgələrinə bənzər əmrlər.

Əgər çıxış faylının adı verilirsə, indeks faylı ona yazılacaq out.index. Əks halda, CRAM faylı üçün aln.cram, indeks faylı aln.cram.crai BAM və ya SAM faylı üçün yaradılacaq aln.bam, ya aln.bam.bai və ya aln.bam.csi seçilmiş indeks formatından asılı olaraq yaradılacaq.

samtools sort [-l səviyyə] [-m maxMem] [-o out.bam] [-O format] [-n] [-t etiket] [-T tmpprefiks] [[email protected] iplər] [in.sam|in.bam|in.cram]

Düzəlişləri ən soldakı koordinatlara görə və ya oxunan zaman adına görə sıralayın -n istifadə olunur. Müvafiq @HD-SO çeşidləmə sırası başlıq teqi əlavə olunacaq və ya lazım gələrsə mövcud yenilənəcək.

Çeşidlənmiş çıxış standart olaraq standart çıxışa və ya göstərilən fayla yazılır (out.bam) nə vaxt -o istifadə olunur. Bu əmr həm də müvəqqəti fayllar yaradacaq tmpprefiks.%d.bam bütün hizalama məlumatları yaddaşa sığmadıqda lazım olduqda ( -m variant).

İstifadə etməyi düşünün samtools toplayır əvəzinə tam leksikoqrafik çeşidləmə olmadan adların toplanmış məlumatlarına ehtiyacınız varsa.

Qarışıqlar və qruplar birlikdə adları ilə oxuyurlar. Tam sorğu adı çeşidinə daha sürətli alternativ, yığmaq eyni adlı oxunuşların bitişik qruplarda qruplaşdırılmasını təmin edir, lakin qruplar arasında oxunan adların sırasına dair heç bir zəmanət vermir.

Bu əmrin çıxışı eyni şablondan bütün oxunuşların qruplaşdırılmasını tələb edən istənilən əməliyyat üçün uyğun olmalıdır.

Giriş faylına uyğun olan indeks faylında statistik məlumatları əldə edin və çap edin. Idxstats-a zəng etməzdən əvvəl giriş BAM faylı samtools indeksi ilə indeksləşdirilməlidir.

SAM və ya CRAM faylı və ya indeksləşdirilməmiş BAM faylı üzərində işlədilirsə, bu əmr yenə də eyni xülasə statistikasını verəcək, lakin bunu bütün faylı oxumaqla edir. Bu, BAM indekslərini istifadə etməkdən daha yavaşdır.

Çıxış istinad ardıcıllığının adı, ardıcıllığın uzunluğu, # xəritələnmiş oxunuş və # xəritəsiz oxunuşdan ibarət hər sətirlə TAB ilə ayrılmışdır. Bu stdout-a yazılmışdır.

Statistikanı hesablamaq və stdout-a çap etmək üçün giriş faylından tam keçid edir.

Əsasən BAYRAQ sahəsində bit bayraqlarına əsaslanan 13 kateqoriyanın hər biri üçün sayları təmin edir. Çıxışdakı hər bir kateqoriya QC keçidinə və QC uğursuzluğuna bölünür, bu, "#PASS + #FAIL" kimi təqdim olunur və ardınca kateqoriyanın təsviri verilir.

Mətn və rəqəmsal bayraq təqdimatı arasında çevirin.

BAYRAQLAR:

0x1Cütləndiqoşalaşmış (və ya çox seqmentli) ardıcıllıq texnologiyası
0x2PROPER_PAIRhər bir seqment hizalayıcıya uyğun olaraq düzgün şəkildə hizalanır
0x4UNMAPseqment xəritədən çıxarıldı
0x8MUNMAPşablonda növbəti seqment xəritədən çıxarıldı
0x10TERSSEQ tərs tamamlanır
0x20ƏQSƏŞablondakı növbəti seqmentin SEQ-u tərs şəkildə tamamlanır
0x40OXUYUN 1şablondakı ilk seqment
0x80OXUYUN 2şablondakı son seqment
0x100İKİNCİLikinci dərəcəli uyğunlaşma
0x200QCFAILkeyfiyyətə nəzarətdən keçməmək
0x400DUPPCR və ya optik dublikat
0x800ƏLAVƏəlavə uyğunlaşdırma

samtools stats BAM fayllarından statistika toplayır və mətn formatında çıxış edir. Çıxış plot-bamstats istifadə edərək qrafik olaraq vizuallaşdırıla bilər.

Təchizat edilmiş BED faylında göstərilən hər bir genomik bölgə üçün ümumi oxunmuş əsas sayını (yəni, hər bir əsas oxuma dərinliklərinin cəmi) bildirir. Regionlar BED faylında göründüyü kimi çıxarılır və 0 əsaslıdır. Təchiz edilmiş hər bir uyğunlaşdırma faylı üçün saylar ayrı-ayrı sütunlarda bildirilir.

Hər mövqe və ya bölgədə oxuma dərinliyini hesablayır.

samtools ampliconstats bir və ya bir neçə daxiletmə uyğunlaşdırma faylından statistika toplayır və mətn formatında cədvəllər hazırlayır. Çıxış plot-ampliconstats istifadə edərək qrafik olaraq vizuallaşdırıla bilər.

Alignment faylları əvvəllər primer ardıcıllığından kəsilmiş olmalıdır, məsələn samtools ampliconclip və bu primerlərin saytları arqumentlərdə yataq faylı kimi göstərilməlidir.

samtools mpileup [-EB] [-C capQcoef] [-r reg] [-f in.fa] [-l siyahı] [-Q minBaseQ] [-q minMapQ] in.bam [in2.bam [. ]]

Bir və ya bir neçə BAM faylı üçün mətn yığını yaradın. VCF və BCF çıxışı üçün istifadə edin bcftools mpileup əvəzinə əmr edin. Hizalama qeydləri @RG başlıq sətirlərində nümunə (SM) identifikatorları ilə qruplaşdırılır. Nümunə identifikatorları yoxdursa, hər bir giriş faylı bir nümunə kimi qəbul edilir.

Yığma formatı və seçimlərinin təsviri üçün samtools-mpileup man səhifəsinə baxın.

Hər xromosom üçün bir histoqram və ya əhatə dairəsi cədvəli istehsal edir.

samtools birləşir [-nur1f] [-h inh.sam] [-t etiket] [-R reg] [-b siyahı] out.bam in1.bam [in2.bam in3.bam . inN.bam]

Bütün giriş qeydlərini ehtiva edən və mövcud çeşidləmə qaydasını saxlayan tək çeşidlənmiş çıxış faylı yaradaraq, çoxsaylı çeşidlənmiş uyğunlaşdırma fayllarını birləşdirin.

Əgər -h müəyyən edilir ki, giriş fayllarının @SQ başlıqları göstərilən başlığa birləşdiriləcək, əks halda onlar giriş başlıqlarından yaradılmış kompozit başlığa birləşdiriləcək. @SQ başlıqları ardıcıllıqla fərqlənirsə, bu, birləşmədən sonra çıxış faylının yenidən çeşidlənməsini tələb edə bilər.

Giriş fayllarında qeydlərin sırası istifadə ilə uyğun olmalıdır -n-t komanda xətti seçimləri. Bunu etmədikdə, çıxış sırası qeyri-müəyyən olacaq. Görmək cür rekord sifariş haqqında məlumat üçün.

samtools bölündü [seçimlər] birləşdirildi.sam|birləşdirildi.bam|birləşdirildi.cram

Hər birində bir oxuma qrupunu ehtiva edən ümumi prefiksə (defolt olaraq daxiletmə faylının adına əsasən) uyğun gələn bir və ya bir neçə çıxış faylı yaradaraq, faylı oxu qrupu üzrə bölür.

samtools pişiyi [-b siyahı] [-h header.sam] [-o out.bam] in1.bam in2.bam [ . ]

BAM və ya CRAM-ları birləşdirin. Bu, BAM və ya CRAM-da işləsə də, bütün giriş faylları bir-biri ilə eyni formatda olmalıdır. Hər bir giriş faylının ardıcıllıq lüğəti eyni olmalıdır, baxmayaraq ki, bu əmr bunu yoxlamaz. Bu əmr oxşar hiylədən istifadə edir təkrar başlıq sürətli BAM birləşməsinə imkan verir.

samtools fastq [seçimlər] in.bam
samtools fasta [seçimlər] in.bam

Çağırılan əmrdən asılı olaraq BAM və ya CRAM-ı FASTQ və ya FASTA formatına çevirir. Fayl adlarının .gz və ya .bgzf uzantısı varsa, fayllar avtomatik olaraq sıxılacaq.

Bu proqrama daxil olanlar adla yığılmalıdır. istifadə edin samtools toplayır və ya samtools sort -n bunu təmin etmək üçün.

samtools faidx <ref.fasta> [region1 [. ]]

FASTA formatında indeks istinad ardıcıllığını və ya indekslənmiş istinad ardıcıllığından alt ardıcıllığı çıxarın. Heç bir bölgə göstərilməyibsə, faidx faylı indeksləşdirəcək və yaradacaq <ref.fasta>.fai diskdə. Regionlar müəyyən edilərsə, alt ardıcıllıqlar götürüləcək və FASTA formatında stdout-da çap olunacaq.

Giriş faylı sıxışdırıla bilər BGZF format.

FASTQ faylları bu əmrlə oxuna və indeksləşdirilə bilər. İstifadə etmədən --fastq hər hansı çıxarılan alt ardıcıllıq FASTA formatında olacaq.

samtools fqidx <ref.fastq> [region1 [. ]]

FASTQ formatında indeks istinad ardıcıllığını və ya indekslənmiş istinad ardıcıllığından alt ardıcıllığı çıxarın. Heç bir bölgə göstərilməyibsə, fqidx faylı indeksləşdirəcək və yaradacaq <ref.fastq>.fai diskdə. Regionlar müəyyən edilərsə, alt ardıcıllıqlar götürüləcək və FASTQ formatında stdout-da çap olunacaq.

Giriş faylı sıxışdırıla bilər BGZF format.

samtools fqidx yalnız az sayda girişi olan fastq fayllarında istifadə edilməlidir. Milyonlarla qısa ardıcıllıq oxunuşunu ehtiva edən bir faylda istifadə etməyə çalışmaq, demək olar ki, orijinal fayl qədər böyük bir indeks yaradacaq və indeksdən istifadə edərək axtarışlar çox yavaş olacaq və çox yaddaş istifadə edəcək.

samtools dict ref.fasta|ref.fasta.gz

Fasta faylından ardıcıl lüğət faylı yaradın.

samtools sakit [-Eubr] [-C capQcoef] aln.bam ref.fasta

MD etiketini yaradın. Əgər MD etiketi artıq mövcuddursa, yaradılan MD teqi mövcud teqdən fərqlidirsə, bu əmr xəbərdarlıq edəcək. Defolt olaraq SAM-ı çıxarın.

Calmd həmçinin CRAM fayllarını oxuya və yaza bilər, baxmayaraq ki, əksər hallarda bu mənasızdır, çünki CRAM MD və NM teqlərini tez bir zamanda yenidən hesablayır. Bu hal üçün bir istisna, həm giriş, həm də çıxış CRAM faylları ilə yaradıldığı / yaradıldığıdır no_ref seçim.

samtools fixmate [-rpcm] [-O format] in.nameSrt.bam out.bam

Ad-sorted düzülüşündən mate koordinatlarını, ISIZE və əlaqə ilə əlaqəli bayraqları doldurun.

samtools markdup [-l uzunluq] [-r] [-s] [-T] [-S] in.algsort.bam out.bam

İşlənmiş koordinat faylından dublikat düzülmələri qeyd edin samtools fixmate ilə -m seçim. Bu proqram fixmate-in təmin etdiyi MC və ms teqlərinə əsaslanır.

samtools rmdup [-sS] <input.srt.bam> <out.bam>

Bu əmr köhnəlmişdir. Bunun əvəzinə markdup istifadə edin.

samtools addressreplacerg [-r rg-xətti | -R rg-ID] [-m rejimi] [-l səviyyə] [-o out.bam] in.bam

Faylda oxunan qrup teqlərini əlavə edir və ya əvəz edir.

samtools reheader [-iP] in.header.sam in.bam

Başlığı dəyişdirin in.bam başlığı ilə in.header.sam. Bu əmr başlığı BAM&rarrSAM&rarrBAM çevrilməsi ilə əvəz etməkdən daha sürətlidir.

Varsayılan olaraq bu əmr BAM və ya CRAM faylını standart çıxışa (stdout) çıxarır, lakin CRAM formatlı fayllar üçün eyni faylı oxumaq və yazmaq üçün yerində redaktə etmək imkanı var. Başlıqda etibarlılıq yoxlanışı aparılmır və onun ardıcıllıq məlumatlarının özü ilə istifadəyə uyğun olması yoxlanılır.

samtools targetcut [-Q minBaseQ] [-i penaltidə] [-0 em0] [-1 em1] [-2 em2] [-f refer] in.bam

Bu əmr oxuma dərinliyinin davamlılığını tədqiq etməklə hədəf bölgələrini müəyyən edir, hədəflərin haploid konsensus ardıcıllığını hesablayır və hər bir hədəfə uyğun gələn ardıcıllıqla SAM çıxarır. Nə vaxt seçim -f istifadə olunur, BAQ tətbiq olunacaq. Bu əmrdir yalnız fosmid hovuz ardıcıllığından fosmid klonlarını kəsmək üçün nəzərdə tutulmuşdur [İst. Kitzman və başqaları. (2010)].

samtools mərhələsi [-AF] [-k len] [-b prefiks] [-q minLOD] [-Q minBaseQ] in.bam

Heterozigot SNP-ləri çağırın və fazalayın.

samtools depad [-SsCu1] [-T ref.fa] [-o çıxış] in.bam

Doldurulmuş istinadla düzlənmiş BAM-ı boşaldılmış istinadla düzülmüş BAM-a çevirir. Doldurulmuş arayışda hərfi "*" əsasları ola bilər, lakin "*" əsasları da istinad nömrələməsində sayılır. Bu o deməkdir ki, "*" istinadına uyğun düzülmüş əsas zəng ardıcıllığı siqar uyğunluğu ("M" və ya "X") operatoru hesab olunur (əgər əsas zəng "A", "C", "G" olarsa və ya "T"). İstinadın boşaldılmasından sonra "*" əsasları silinir və belə düzülmüş ardıcıllıqla baza zəngləri əlavələrə çevrilir. Eynilə transformasiyalar silinmə və siqarın doldurulması əməliyyatları üçün də tətbiq edilir.

samtools ampliconclip [-o out.file] [-f stat.file] [--yumşaq klip] [--sərt klip] [--hər iki-ucu] [--tel] [--kəsilmiş] [--uğursuz] [--no-PG] -b yataq.fayl.fayl

Klip BED faylından verilənlər əsasında SAM uyğun faylda oxunur.


İcra

Ümumi baxış vcfanno funksionallıq

Vcfanno BED, GFF, GTF, VCF və kimi ümumi genomik formatlarda saxlanılan çoxlu müxtəlif annotasiya faylları ("verilənlər bazası" intervalları) arasında kəsişən intervallar toplusundan toplanmış məlumatla VCF faylındakı variantları ("sorğu" intervalları) şərh edir. BAM. O, yaddaş istehlakını əhəmiyyətli dərəcədə azaltmaq və sürəti artırmaq üçün çeşidlənmiş daxiletmə fayllarından istifadə edən "axın" kəsişmə alqoritmindən istifadə edir. Axın kəsişməsi yerinə yetirildiyi üçün (aşağıdakı təfərrüatlar), verilənlər bazası intervalları, əgər interval kəsişməsi varsa, sorğu intervalı ilə əlaqələndirilir. Müəyyən bir sorğu intervalı üçün bütün kəsişmələr məlum olduqdan sonra, annotasiya atributlara tətbiq edilən istifadəçi tərəfindən müəyyən edilmiş əməliyyatlara uyğun olaraq davam edir (məsələn, BED annotasiya faylındakı “bal” sütunu və ya VCF annotasiyasının INFO sahəsindəki atribut). fayl) verilənlər bazası intervalları daxilində verilənlər. Sadə bir misal olaraq, dbSNP resursunun VCF faylı kimi annotasiya verilənlər bazasından SNV-lər tərəfindən şərh edilmiş tək nukleotid variantlarının (SNV) VCF sorğusunu nəzərdən keçirək. Bu halda, sorğu və verilənlər bazası variantları mövcud olduqda mövqe, REF və ALT sahələrinə uyğunlaşdırılır və üst-üstə düşən verilənlər bazası intervalından bir dəyər (məsələn, kiçik allel tezliyi) INFO sahəsində saxlanılan annotasiyaya çevrilmək üçün irəli aparılır. VCF sorğusu. Sorğunun struktur variantının hər bir verilənlər bazasından çoxsaylı annotasiya intervalları ilə kəsişdiyi daha mürəkkəb ssenaridə həmin intervallardan alınan məlumatlar birləşdirilməlidir. Atributların hər birini “concat” əməliyyatı vasitəsilə vergüllə ayrılmış siyahı kimi bildirmək istəyə bilər. Alternativ olaraq, “maksimum” əməliyyatı vasitəsilə maksimum allel tezliyini seçmək olar. Sorğu ilə yalnız bir verilənlər bazası intervalının əlaqəli olduğu hallar üçün əməliyyat seçimi ümumiləşdirilmiş dəyərə təsir etməyəcək.

ilə annotasiyadan əvvəl və sonra tək variantdan nümunə VCF INFO sahəsi vcfanno Şəkil 1-də göstərilmişdir. Sadə konfiqurasiya faylı həm mənbə faylları, həm də əlavə edilməli olan atributlar dəstini (VCF vəziyyətində) və ya sütunları (BED və ya digər nişanla ayrılmış formatlarda) müəyyən etmək üçün istifadə olunur. sorğu faylına. Bundan əlavə, konfiqurasiya faylı yaranan VCF INFO sahəsində annotasiyaların adının dəyişdirilməsinə imkan verir. Məsələn, biz ExAC VCF faylından [9] allel tezliyi (AF) atributunu çıxara və VCF sorğu qeydlərinin INFO sahəsində onun adını “exac_aaf” kimi dəyişə bilərik. Konfiqurasiya faylı istənilən sayda annotasiya verilənlər bazasından lazım olan qədər atribut çıxarmağa imkan verir.

Ümumi baxış vcfanno iş axını. Qeyd edilməmiş VCF (a) ünvanına göndərilir vcfanno (b) annotasiya fayllarına gedən yolları, hər bir fayldan çıxarılacaq atributları və həmin fayllardan çıxarılan dəyərləri təsvir etmək və ya ümumiləşdirmək üçün istifadə edilməli olan üsulları göstərən konfiqurasiya faylı ilə birlikdə. Nəticədə VCF-də yeni qeydlər (c) INFO sütununa əlavə edilmiş əlavə sahələrlə mavi mətnlə göstərilir

Xrom tarama alqoritminə ümumi baxış

Xromosom süpürmə alqoritmi (“xrom süpürmə”) axın, çeşidləmə-birləşdirmə birləşmə alqoritminin uyğunlaşdırılmasıdır və həm xromosom, həm də interval başlanğıc mövqeyinə görə çeşidləndiyi müddətcə çoxlu interval faylları arasında interval kəsişmələrini effektiv şəkildə aşkar etməyə qadirdir. . Həm BEDTOOLS [10, 11], həm də BEDOPS [12] tərəfindən istifadə edilən xrom süpürmə genomik mövqe ilə sinxronlaşdırılan hər bir faylda göstəriciləri irəliləyərək bir keçiddə kəsişmələri tapır. Süpürmənin hər bir addımında bu göstəricilər müəyyən bir mövqe ilə kəsişən və öz növbəsində bir-birini kəsən intervallar toplusunu saxlayır. Bu strategiya böyük verilənlər topluları üçün sərfəlidir, çünki o, interval ağacları və ya iyerarxik qutular (məsələn, UCSC binning alqoritmi [13]) kimi məlumat strukturlarının istifadəsindən yayınır. Bu ağac və bağlama üsulları çeşidlənmiş giriş tələb etməsə də, bu metodların yaddaş izi, xüsusən də adətən aşağı, orta ölçülü yaddaş tələbləri nümayiş etdirən axın alqoritmləri ilə müqayisədə zəif ölçülür.

Xrom tarama alqoritmi tətbiq olunur vcfanno aşağıdakı kimi davam edir.Birincisi, biz VCF sorğusu və hər bir verilənlər bazası annotasiya faylı üçün interval qeydlərinin iteratorunu yaradırıq. Daha sonra biz VCF sorğusundan və hər bir annotasiyadan intervalları bir prioritet növbəyə birləşdiririk, bu növbə bütün fayllardakı intervalları xromosomlara görə sıralayır və koordinatları başlayır, eyni zamanda hər intervalın gəldiyi faylı izləyir. Vcfanno prioritet növbədən aralıq tələb etməklə irəliləyir və onu keşə daxil edir. Ən son müşahidə edilən interval VCF sorğusundandırsa, biz hazırda keşdə olan bütün verilənlər bazası intervalları ilə kəsişmələri yoxlayırıq. ildən vcfanno bütün faylların çeşidlənməsini tələb edir, biz bilirik ki, intervallar başlanğıc koordinatı ilə sıralanmış keş yaddaşa daxil olur. Buna görə də, üst-üstə düşməyi yoxlamaq üçün yalnız yeni intervalın başlanğıcının keşdəki hər hansı bir intervalın sonundan az olduğunu yoxlamaq lazımdır (yarı açıq intervalları nəzərə alaraq). Süpürmə alqoritminin nümunəsi Şəkil 2-də bir VCF sorğusundan iki annotasiya faylı və üç qeydi əhatə edən iş üçün göstərilmişdir. Keşin məzmunu tarama hər yeni intervalın başlanğıcına çatdıqda göstərilir. Yeni sorğu intervalı önbelleğe daxil olduqda, onu kəsməyən istənilən interval keşdən çıxarılır. Silinmiş interval VCF sorğusundan yaranıbsa, o, hər kəsişən annotasiya intervalları ilə birlikdə konfiqurasiya faylında göstərilən əməliyyatlara uyğun olaraq emal edilmək üçün göndərilir. Nəticədə annotasiyalar VCF faylının INFO sahəsində saxlanılır və yenilənmiş VCF qeydi çıxış kimi bildirilir.

Xrom tarama intervalının kəsişmə alqoritminə ümumi baxış. Xrom süpürmə alqoritmi dən süpürür sol üçün sağ hər bir xromosom boyunca irəlilədikcə. Yaşıl VCF sorğusundan aralıqlar birinci sıra annotasiya faylları ilə qeyd olunur A (mavi) və B (narıncı) içində ikinciüçüncü sıralar, müvafiq olaraq. Keş cərgəsi süpürmə alqoritminin gedişatının hər bir nöqtəsində hazırda hansı intervalların keşdə olduğunu göstərir. Intervallar xromosomal başlanğıc mövqeyinə görə önbelleğe daxil olur. Birinci A1 ardınca keş yaddaşa daxil olur Q1. ildən Q1 kəsişir A1, onlar olduğu kimi əlaqələndirilir Q1B1 nə vaxt B1 önbelleğe daxil olur. Hər dəfə yeni sorğu intervalı önbelleğe daxil olduqda, onun kəsişmədiyi istənilən interval çıxarılır. Buna görə də, nə vaxt Q2 önbelleğe daxil olur, Q1A1 atılır. ildən Q1 sorğu intervalıdır, çıxış kimi bildirilmək üçün göndərilir. Sağa doğru gedərək, A2 daha sonra Q3 keşi daxil edin, sonuncu sorğu intervalıdır və buna görə də üst-üstə düşməyən intervallar—B1, Q2, və A2— sorğu intervalı ilə keşdən çıxarılır, Q2, zəng edənə göndərilir. Nəhayət, gələn intervalların sonuna çatdıqda, finalı təmizləyirik Q3 intervalını təyin edin və bu xromosom üçün çıxışı yekunlaşdırın. EOF: Faylın sonu

Xrom tarama alqoritminin məhdudiyyətləri

Annotasiya dəstlərinin yaddaş tutumlu məlumat strukturlarına yüklənməməsi səbəbindən xrom tarama alqoritmi asanlıqla böyük verilənlər toplusuna miqyaslanır. Bununla belə, onun bəzi mühüm məhdudiyyətləri var. Birincisi, bütün annotasiya fayllarının bütün intervallarının eyni xromosom sırasına uyğun olmasını tələb edir. Konseptual cəhətdən sadə olsa da, bu, xüsusilə ağırdır, çünki GATK kimi variant zəng edənlər tərəfindən istehsal olunan VCF-lər MT-ni X-dən əvvəl qoyacaq əksər digər ədədi olaraq çeşidlənmiş annotasiya fayllarından fərqli xromosom sırası (1, 2, …21, X, Y, MT) tətbiq edir. və Y. Təbii ki, rəqəmli xromosomların simvollar və ya tam ədədlər kimi çeşidlənməsi də müxtəlif çeşidləmə sıraları ilə nəticələnir. Fayllar arasında xromosom sıralamasındakı uyğunsuzluqlar çox vaxt əsaslı hesablamalar aparılmayana qədər aşkar edilmir. Əlaqədar problem, bir faylda verilmiş xromosomdan digərində olmayan intervallar olduqda, bütün intervallar təhlil edilənə qədər xromosom sırasının fərqli olub-olmadığını və ya bu xromosomun sadəcə olaraq fayllardan birində olmadığını ayırd etmək mümkün deyil.

İkincisi, standart xrom tarama tətbiqi optimal deyil, çünki o, çox vaxt sorğu intervalları ilə heç vaxt kəsişməyən çoxlu annotasiya intervallarını nəzərdən keçirməyə (və təhlil etməyə) məcbur olur və bu da lazımsız işə səbəb olur [14]. Məsələn, genom üzrə seyrək paylanmış variantlardan ibarət VCF faylı (məsələn, tək bir ekzom tədqiqatından alınan VCF) və bütöv genom annotasiyalarının sıx məlumat dəstləri nəzərə alınmaqla, xrom taraması bütövlükdə hər bir intervalı təhlil etməli və sınaqdan keçirməlidir. maraq sahələri fayldakı regionların 1%-dən azını təşkil etsə də, sorğu intervalı ilə kəsişmə üçün genom annotasiyaları. Başqa sözlə, sıx annotasiya faylları olan seyrək sorğular xrom taramanın icrası üçün ən pis vəziyyət ssenarisini təmsil edir, çünki məlumat dəstlərindəki intervalların yüksək nisbəti heç vaxt kəsişməyəcək.

Xrom tarama alqoritminin üçüncü məhdudiyyəti ondan ibarətdir ki, alqoritmin mahiyyətcə serial xarakterinə görə, interval kəsişmələrinin aşkar edilməsini paralelləşdirmək çətindir və vahid CPU performansı intervalların təhlil oluna biləcəyi sürətlə məhdudlaşır. Fasilələr çeşidlənmiş qaydada gəldiyi üçün, hər bir fayldan yeni bir bölgəni fərqli bir emal ipində emal etmək üçün irəliyə keçmək, intervalların əvvəlcədən hesablanmış məkan indeksi olmadan çətindir və kəsişmədən sonra intervalların çeşidlənmiş qaydada bildirilməsi əlavə mühasibat uçotu tələb edir.

Paralel xrom tarama alqoritmi

Bu çatışmazlıqları aradan qaldırmaq üçün biz paralel olaraq sorğu və verilənlər bazası intervallarının "parçalarını" xrom-süpürən paralel alqoritm hazırladıq. Girişi [15] bərabər bölən əvvəlki yaddaşdaxili paralel süpürmə üsullarından fərqli olaraq, biz (öncədən işləməyə [16] ehtiyac olmadan) iki kriteriyadan birinə cavab verən ardıcıl sorğu intervalları ilə parçaları müəyyənləşdiririk: ya dəst “yığın ölçüsünə” çatır. eşik həddi və ya növbəti intervala qədər olan genomik məsafə “boşluq ölçüsü” həddini aşır. Parça ölçüsünün məhdudlaşdırılması səmərəli yük balansını dəstəkləmək üçün iplər arasında ağlabatan bərabər iş yaradır (yəni, tapşırıqların fərqinə varmamaq üçün). Boşluğun ölçüsünün kəsilməsi, uzaq sorğu intervalları arasında yerləşən çox sayda əlaqəsiz verilənlər bazası intervallarının işlənməsinin qarşısını almaq üçün nəzərdə tutulmuşdur.

Parça müəyyən edilən kimi, əvvəllər müəyyən edilmiş digər parçalarla paralel olaraq süpürülməsi planlaşdırılır. Parçadakı sorğu intervallarının hüdudları hər bir annotasiya faylından tələb olunan intervalların diapazonunu müəyyən edir (şək. 3). Hazırda bu sorğular ya Tabix [17] indeksli faylı, ya da bioqo paketi [18] vasitəsilə BAM faylıdır, lakin istənilən məkan sorğusu asanlıqla dəstəklənə bilər. Bu sorğulardan istifadə edərək verilənlər bazası intervallarının toplanmasının mühüm yan təsiri odur ki, annotasiya faylları çeşidlənməlidir, annotasiyaların xromosom sıralarının uyğun olmasına ehtiyac yoxdur. Bu, hər hansı bir “chr” prefiksini daxildən silməklə yanaşı, yuxarıda təfərrüatları verilmiş əlaqəli xromosom nizamını və təmsil mürəkkəbliyini yüngülləşdirir. Bu sorğulardan alınan intervallar dəsti, yığını tamamlamaq üçün sorğu intervalları ilə inteqrasiya olunur, daha sonra standart xrom tarama alqoritmi ilə işlənir. Bununla belə, praktikada bu, axınlar vasitəsilə həyata keçirilir ki, xrom tarama zamanı annotasiya intervalları öz iteratorlarından götürülərkən yalnız sorğu intervalları yaddaşda saxlanılsın. Bu strategiyada bir performans problemi ondan ibarətdir ki, çıxış çeşidlənməlidir və parçalar istənilən ardıcıllıqla bitə bildiyi üçün biz çeşidlənmiş sıranı bərpa etmək üçün tamamlanmış parçaları bufer etməliyik. Bu, disk sürəti məhdudiyyətləri ilə yanaşı, optimal paralelləşdirmə səmərəliliyinin qarşısını alan əsas yük mənbəyidir.

Paralel süpürmə alqoritmi. Şəkil 2-də olduğu kimi, biz xromosomu aşağıdan yuxarı mövqelərə keçirik (və sol üçün sağ şəkildə). The yaşıl sorğu intervalları ilə təsvir edilmiş iki annotasiya faylı ilə qeyd edilməlidir mavinarıncı intervallar. Paralelləşmə baş verir parçalar ilə təsvir edilən sorğu intervallarının qara şaquli xətlər. Bir proses növbəti intervala maksimum boşluq ölçüsünə çatana qədər (məsələn, 2, 4-cü hissələr) və ya intervalların sayı yığın ölçüsü həddini keçənə qədər (məsələn, 1, 3-cü hissələr) sorğu intervallarını yaddaşa oxuyur. Sorğu intervallarının yeni dəsti yığılarkən, birinci ilə sağa bağlanan ilk yığın şaquli qara xətt yuxarıda, süpürmək üçün göndərilir və yer tutucu FIFO (ilk gələn, ilk çıxan) növbəsinə qoyulur, beləliklə, digər hissələri birinci bitirə bilsə də, çıxış çeşidlənmiş qalır. Annotasiya faylları sorğu yığınındakı intervalların hüdudlarına əsaslanaraq bölgələrlə sorğulanır. Sorğular sonra intervalların axınlarını qaytarır və nəhayət, bu axınlar yeni prosesdə xrom tarama alqoritminə göndərilir. Bitirdikdə, onun yer tutucusu FIFO növbəsindən çıxarıla bilər və nəticələr çıxış üçün verilir.

Vcfanno həyata keçirilməsi

Vcfanno bir sıra üstünlükləri təmin edən Go (https://golang.org) dilində yazılmışdır. Birincisi, Go Mac, Linux və Windows üçün 32 və 64 bit sistemlər üçün çarpaz tərtibi dəstəkləyir. Go-nun performansı bu deməkdir vcfanno böyük məlumat dəstlərini nisbətən tez emal edə bilir. Go həmçinin imkan verən sadə paralel model təklif edir vcfanno Paralel tətbiqləri tez-tez narahat edən yarış şəraiti və yük balansı problemlərinin mümkünlüyünü minimuma endirməklə paralel olaraq kəsişmələri yerinə yetirmək. Bundan əlavə, Nəticələr bölməsində nümayiş etdirdiyimiz kimi, vcfannoxrom tarama alqoritminin paralel tətbiqi sürət və genişlənmə imkanı verir. Nəhayət, BED, VCF, GFF, BAM və GTF kimi bir çox ümumi formatlarda təqdim olunan annotasiyaları dəstəklədiyi üçün çox çevik bir vasitədir.


%>% .$column_name R əsas borusu üçün ekvivalent |>

Baza borusunda boruda ötürülən məlumatlar üçün yer tutucu təmin edilmir. Bu magrittr borusu ilə əsas R borusu arasındakı fərqdir. Siz obyektə daxil olmaq üçün anonim funksiyadan istifadə edə bilərsiniz.

|> ilə $-ın birbaşa istifadəsi hazırda qeyri-aktivdir. Bəlkə də bir səbəb yazmaq ola bilər

Əgər $ çağırışı (və ya |>-dəki digər qeyri-aktiv funksiyalar) hələ də lazımdırsa, @jay-sf həllinə bənzər funksiyanın yaradılması ilə yanaşı, əsas olaraq :: funksiyası vasitəsilə $-dan istifadə etmək olar: :`VCF məlumat sahəsində boru simvolunun istifadəsi - Biologiya,[nobr][H1toH2] və ya onu əyləclərə qoyun ( $ ) :

Başqa bir seçim a-dan istifadə ola bilər qəribə boru ->. . Bəziləri bunu zarafat adlandırır, digərləri isə mövcud sintaksisdən ağıllı istifadə edir.

Bu yaradır və ya üzərinə yazır. Bu .GlobalEnv . rm(.) onu silmək üçün istifadə edilə bilər. Alternativ olaraq yerli olaraq emal edilə bilər:

Bu halda o, ətraf mühitdə iki eyni obyekti istehsal edir iris və . amma nə qədər ki dəyişdirilməyib eyni ünvanı göstərirlər.


Nə yenilik var?

Görünməmiş sürət
Bitwise operatorlarından, ardıcıl yaddaşa giriş nümunələrindən, çox iş parçacığından və daha yüksək səviyyəli alqoritmik təkmilləşdirmələrdən intensiv istifadə sayəsində PLINK 1.9 PLINK 1.07 və digər populyar proqram təminatından çox, çox daha sürətlidir. Ən tələbkar işlərdən bir neçəsi, o cümlədən ştat üzrə matrisin hesablanması, məsafəyə əsaslanan klasterləşdirmə, LD əsaslı budama, haplotip blokunun identifikasiyası və assosiasiya analizi max(T) permutasiya testləri, indi yüzlərlə və hətta minlərlə dəfə tez tamamlanır. , və hətta ən mənasız əməliyyatlar I/O təkmilləşdirmələri səbəbindən 5-10 dəfə daha sürətli olur.

Əlavə etməyə tələsirik ki, PLINK 1.9-un işinə töhfə verən ideyaların böyük əksəriyyəti bir neçə halda başqa yerlərdə işlənib, biz sadəcə olaraq az tanınan, lakin görkəmli tətbiqləri əhəmiyyətli əlavə revize etmədən (hətta onları tanınmaz dərəcədə çirkinləşdirə bilsələr də, buna görə üzr istəyirik) Roman.). Təşəkkür ediləcək insanların qismən siyahısı üçün kreditlər səhifəsinə baxın. Bununla əlaqədar olaraq, əgər hazırda etdiyimiz işdən xeyli yaxşı olan PLINK əmrinin tətbiqindən xəbərdarsınızsa, bizə bildirin ki, biz onların alqoritminə keçməkdən və sənədlərimizdə və sənədlərimizdə onlara kredit verməkdən məmnun olarıq.

Təxminən qeyri-məhdud miqyas
Əsas genomik məlumat matrisi artıq RAM-a sığmaq məcburiyyətində deyil, buna görə də on minlərlə nümunənin ekzom və ya tam genom ardıcıllığından əldə edilən milyonlarla variant çağırışını ehtiva edən ən son məlumat dəstləri adi masaüstü kompüterlərdə işlənə bilər (və bu emal adətən başa çatacaq) ağlabatan müddətdə). Bundan əlavə, bir neçə əsas nümunə x nümunəsi və variant x variant matris hesablamaları (aşağıda qeyd olunan GRM daxil olmaqla) hesablama klasterləri arasında təmiz şəkildə bölünə bilər (yaxud bir kompüter tərəfindən idarə oluna bilən hissələrdə ardıcıl olaraq idarə olunur).

Komanda xətti interfeysinin təkmilləşdirilməsi
Biz komanda xətti təhlilçisinin necə işlədiyini standartlaşdırdıq, orijinal "hər şey bir bayraqdır" dizaynından daha mütəşəkkil bayraqlar + dəyişdiricilər yanaşmasına keçdik (geri uyğunluğu saxlamaqla) və hərtərəfli komanda xətti yardımı əlavə etdik.

Əlavə funksiyalar
2009-cu ildə GCTA mövcud deyildi. Bu gün qarışıq model assosiasiya analizində və digər hesablamalarda genetik əlaqə matrislərinin istifadəsini dəstəkləyən alətlərin mühüm və böyüyən ekosistemi mövcuddur. Bizim töhfələrimiz sürətli, çox yivli, yaddaşa qənaət edən --make-grm-gz/--make-grm-dir. macOS və Windows, eləcə də Linux-da işləyən bin tətbiqi və daha optimala yaxın --rel-cutoff pruner.

Burada və orada başqa əlavələr var, məsələn, bir neçə populyasiya genetikçisinin həyatını asanlaşdıra biləcək çoxluq əsaslı filtrlər və koordinat enişli LASSO. Yeni funksiyalar hazırda əsas prioritet deyil (95%+ geriyə uyğunluğa çatmaq və dozaj/mərhələli/trialel məlumatı dəstəkləmək daha vacibdir. ), lakin biz proqramın əsas üzərində işləməkdən vaxt ayırmağa hazırıq. gözəl soruş.


qurmaq
Əməliyyat sistemiİnkişaf (8 İyun)Alpha 2.3 final (24 Yanvar 2020)
Linux AVX2 Intel 1 yükləyinyükləyin
Linux 64-bit Intel 1 yükləyinyükləyin
Linux 32-bityükləyinyükləyin
macOS AVX2yükləyinyükləyin
macOS 64-bityükləyinyükləyin
Windows AVX2yükləyinyükləyin
Windows 64-bityükləyinyükləyin
Windows 32-bityükləyinyükləyin

1: Bu quruluşlar hələ də AMD prosessorlarında işləyə bilər, lakin onlar statik olaraq Intel MKL ilə əlaqələndirilir, ona görə də bəzi xətti cəbr əməliyyatları yavaş olacaq. Dəstəkləyici kitabxanalar mövcud olan kimi biz AMD Zen üçün optimallaşdırılmış quruluş təqdim etməyə çalışacağıq.

Mənbə kodu və qurma təlimatları GitHub-da mövcuddur. (Budur mənbə kodunun başqa bir nüsxəsi.)

Son versiya tarixçəsi

8 iyun 2021: --sort-vars ilə və ya aşağı yaddaş şəraitində baş verə biləcək çoxallelik-variant yazma xətası (adətən seqmentasiya xətası və ya təsdiqləmə uğursuzluğu kimi özünü göstərir) düzəldildi.

25 May: .fa yükləyicisi indi boş sətirlərə dözür. çoxlu axın və ya arxada qalan zibil olan gzip faylları yenidən qəbul edilməlidir.

23 May: FID+IID+SID yüklənməsi düzəldildi (son qurmalar yanlış "SID sütunu IID sütununu dərhal izləmir" xətası verirdi).

5 May: Sabit - 16 Yanvarda təqdim edilən səhv daxilində.

20 aprel: --het cols= indi düzgün işləməlidir.

16 aprel: --data/--gen indi 6 aparıcı sütunlu .gen fayllarını dəstəkləyir. Bu format "--export oxford-v2" ilə ixrac edilə bilər.

14 aprel: --pmerge-list artıq sistemin #-of-open-fayl qapağı ilə məhdudlaşdırılmamalıdır.

13 aprel: --glm yerli-covariate-işləmə səhvi. Sabit --pmerge[-list] səhvi çoxallelik variantlar mövcud olduqda yaradılan .pgen başlığının etibarsız olmasına səbəb ola bilər.

6 aprel: --data/--sample indi 'C' sütun tipini 'P' (davamlı fenotip) üçün sinonim kimi tanıyır. (Bu quruluşda səhv "6 Mart" tarix işarəsi var, buna görə üzr istəyirik.)

28 Mart: --nümunə sayar chrX heç bir məlum kişi səhv düzəlişi.

25 mart: --pmerge[-list] .bim-işləmə səhvləri.

23 Mart: Unbreak --make-pgen + --sort-vars (bu, 28 Fevral quruluşu ilə pozuldu).

2 mart: --pmerge[-list] səhv düzəlişləri (əgər çıxış .pvar faylı artıq mövcuddursa, bütün variantlar müxtəlif mövqelərdə olduqda artıq segfaults yoxdur, əgər giriş faylı birdən çox xromosomu əhatə edirsə əlavə etmək əvəzinə əvvəlcə silinir, artıq yoxdur. Ehtimal olunan təsdiqləmə uğursuzluğu eyni mövqeli eyni ID variantlarının birləşməsi ilə bağlı bəzi problemləri həll etdi).

1 Mart: --pmerge-list-dir bayrağı həyata keçirildi (bütün --pmerge-list girişləri üçün ümumi kataloq prefiksini təyin edir).

28 Fevral: --pmerge[-list] indi birləşmə kimi işlər üçün istifadə edilə bilər.
Qeyd edək ki, o etmir xromosomlara bölünmüş verilənlər toplusunda sırf birləşməni mütləq yerinə yetirin: əgər fayldakı iki variant eyni mövqeyə və identifikatora malikdirsə, onlar elə bir şəkildə birləşdiriləcəklər. yox tək identifikatoru paylaşan 'bölünmüş' multiallelik variantlarla uyğun gəlir (bunlar xüsusi 'qoşulma' əməliyyatı ilə birləşdirilməlidir, məsələn, "bcftools norma -m +"). Nəticə olaraq, --pmerge[-list] bu cür bölünmüş variantı aşkar etdikdə səhvə yol verir. Çözüm yollarından biri, bölünmüş variantın hər bir parçasına fərqli identifikatorlar təyin etmək üçün --set-all-var-ids istifadə etməkdir.

3 fevral: FILTER dəyərləri INFO/PR və ya CM dəyərləri ilə eyni vaxtda müvafiq olduqda işə salınan .pvar yükləmə xətası düzəldildi. Həm REF, həm də ALT-nin çatışmadığı variantları ehtiva edən .ped-dən əldə edilmiş fayl dəstlərinə yenidən icazə verilir (belə variantlar son quruluşlarda qadağan edilib). --vcf-ref-n-çatışmayan bayraq .ped-dən əldə edilmiş VCF-lərin təkrar idxalını sadələşdirmək üçün əlavə edildi. --pgen-diff çıxışından əlavə nişanlar silindi.

23 Yanvar: --chr-set indi MT-ni haploid vəziyyətinə qoyur. ##chrSet .pvar başlıq xətti müvafiq əmr xətti bayrağı olmadan indi chrX, chrY və MT ploidiyasını düzgün şəkildə işə salır.

18 Yanvar: ##chrSet .pvar başlıq xətləri indi VCFv4.3 spesifikasiyasına uyğundur (ID sahəsi daxil edilir). VCF/BCF ixracı indi daha çox başlıq təsdiqini həyata keçirir.

16 Yanvar: --update-parents indi digər əmrlərdəki 'maybeparents' çıxış sütun dəstləri ilə düzgün işləyir.

14 Yanvar: --update-ids indi FID sütunu yaratdıqda digər əmrlərdəki "maybefid" çıxış sütun dəstləri ilə düzgün işləyir.

4 Yanvar: --normalize indi itkin və '*' allellərini düzgün şəkildə atlayın.

3 Yanvar: Fazasız multiallelik variantlara təsir edən --bcf səhvi düzəldildi (adətən saxta "GT yarım zəng" qəzası ilə nəticələnir, lakin siz bunu --vcf-half-call ilə söndürsəniz, məlumatlar düzgün idxal edilməyəcək). Eyni adları olan FILTER/INFO/FORMAT düymələri ilə başlıqlarda baş verən "--export bcf" səhvi və çoxsaylı FILTER xətaları olan variantlarda baş verən qəza düzəldildi. --çıxış-əskik-genotip/--çıxış-əskik-fenotip səhvlərinin düzəldilməsi/təmizləmə.

2 Yanvar: --pgen-diff çoxallelik-variantla işləmə səhvi düzəldildi. --pgen-diff DS müqayisəsi həyata keçirilir. --adjust cols= təhlil edilən bugfix ('cols=+qq' indi işləməlidir).

1 Yanvar 2021: SID-lə işləmə ilə bağlı bir neçə səhv düzəlişləri. --sample-diff 'dosage' və 'id-delim=' modifikatoru komanda xəttini təhlil edən səhv düzəlişləri. --sample-diff artıq müqayisə edilən nümunələrdə olmadıqda sonrakı ALT allellərini buraxmır. --pgen-diff GT müqayisəsi həyata keçirildi (PLINK 1.x --merge-mode 6/7-nin ümumiləşdirilməsi).

12 Dekabr 2020: --q-xal-aralığı xal-orta, ALLELE_CT, DENOM və NAMED_ALLELE_DOSAGE_SUM sütununda düzəliş.

28 Oktyabr: Çox keçidli "--export A" səhvi düzəldin. Əgər əvvəllər plink2 "--export A" faylını yaddaşa sığdırmaq üçün çox böyük bir faylda işlətmisinizsə, bu quruluşla yenidən işləməyi tövsiyə edirik.

20 oktyabr: --fst Weir-Cockerham metodu tətbiq edildi. --fst ids= və chrX səhv düzəlişləri. --fst variant-report OBS_CT indi əhali cütlüyünə xasdır.

19 Oktyabr: Linux ikili faylları indi --native göstərilmədiyi təqdirdə maşınlar arasında təkrarlana bilən nəticələr verməlidir (əvvəllər Intel MKL fərqli üzən nöqtə yuvarlaqlaşdırma davranışı ilə prosessordan asılı kod yollarını seçə bilərdi). --fst Hudson metodu həyata keçirilir. Kateqorik fenotiplər daxilindəki kateqoriyalar indi təbii sıralanmış qaydada bildirilir. --variant-hesab MISSING_CT/OBS_CT səhvinin düzəldilməsi.

23 Sentyabr: --update-ids no-FID bugfix.

14 sentyabr: --glm + --parametrləri chrX/chrY səhv düzəldilməsi.

31 avqust: --data/--sample indi QCTOOLv2-nin .sample dialektini dəstəkləyir. --export 'sample-v2' onu ixrac edir.

27 iyul: --glm 'cc-residualize' həyata keçirildi. Nəzərə alın ki, çox sayda itkin genotip varsa, bu təxminlər tövsiyə edilmir.

25 iyul: --glm 'firth-residualize' dəyişdiricisi əlavə edildi. Bu, Mbatchou J et al-da təqdim olunan sürətli Firth yaxınlaşmasını həyata keçirir. (2020) Kəmiyyət və ikili əlamətlər üçün hesablama baxımından səmərəli bütün genom reqressiyası.

6 iyul: --af-pseudocount bayrağı tətbiq olundu, bu, sizə allel tezliyinin qiymətləndirilməsi üçün 0 və ya 1-dən başqa psevdosayımı təyin etməyə imkan verir.

1 İyul: --make-[b]pgen 'dozadan-əskik-doza' dəyişdiricisi həyata keçirildi, heç bir itkin sərt zəng tələb etməyən alqoritmləri dəstəkləmək üçün.

27 İyun: --hardy/--hwe chrX multiallelic-variant idarə səhvləri.

25 İyun: Yanıltıcı "Belə fayl və ya qovluq yoxdur" faylı oxuma xətası mesajı dəyişdirildi.

15 İyun: --glm local-covar= ID uzunluqları məqbul olduğu müddətcə uzun RFMix2 başlıq xətlərində artıq xətalar olmayacaq.

31 May: Tək dəqiqlik - variant hesab rejimi əlavə edildi.

11 May: Kateqorik kovariativlər mövcud olduqda baş verən, lakin heç birinin 2-dən çox kateqoriyası olmayan --glm segfault düzəldildi.

9 aprel: Birinci reqressiyanın tətbiqi indi R logistf() ilə eyni maxit=25 dəyərindən istifadə edir. Daha çox iterasiya ilə dəyişəcək logistika/Birinci reqressiya nəticələrinə 'BİTMƏMİŞDİR' xəta kodu əlavə edildi.

28 Mart: 21 Mart quruluşunda sıfır-MAF biallelik variantları mövcud olduqda segfaultlara səbəb olan --glm səhvi düzəldildi. --glm indi "allow-no-covars" modifikatoru göstərilmədikdə, heç bir kovariat faylı göstərilmədikdə xətalar yaranır.

21 Mart: 'genotipik', 'hethom', 'dominant', 'resessiv', 'qarşılıqlı' və ya --testlər müəyyən edildikdə və düzəldilmiş 'dominant'/' baş verə biləcək çoxallelik-variant idarə səhvləri düzəldildi. resessiv sənədlər. Digər allellər üçün --glm nəticələrini əldə etmək üçün multiallelik variantlardan sıfır (və ya digər sabit) doza allellərini kəsmək artıq lazım deyil.

14 Mart: --make-pgen/--make-just-pvar 'vcfheader' sütun dəsti əlavə edildi (bu, birbaşa etibarlı saytlar üçün VCF yaratmağa imkan verir). .pvar faylının Bgzipping birbaşa dəstəklənmir, lakin siz aşağı yüklə bunu yerinə yetirmək üçün adlandırılmış borudan istifadə edə bilərsiniz.

11 Mart: Heç bir kovariativ göstərilmədikdə baş verə biləcək sabit --glm segfault. VCF/BCF idxalçıları indi müvəqqəti .pvar faylını defolt olaraq sıxışdırırlar, beləliklə çoxlu INFO sahəsi məzmunu olan fayllar işləmək üçün qeyri-proporsional olaraq böyük miqdarda boş disk sahəsi tələb etmir. --keep-autoconv indi .pvar faylının sıxılmasını tələb etmək üçün "vzs" dəyişdiricisinə malikdir (və əksinə, --vcf/--bcf çılpaq --keep-autoconv ilə istifadə edildikdə, .pvar sıxılmır).

10 Mart: Hər hansı mərhələli sərt zənglər olmadan mərhələli dozalar mövcud olduqda baş verən --make-pgen segfault düzəldildi.

8 Mart: "--export bcf" həyata keçirildi. VCF-eksport çoxallelik HDS-güclü səhv düzəlişləri. Resurslar səhifəsində bütün genom 1000 Genom mərhələsi 3 şərhli .pvar fayllarına çatışmayan FILTER/fa başlıq xətti əlavə edildi.

25 fevral: --ld multialelik-mərhələli məlumatların işlənməsi səhvi.

22 fevral: --bcf n_allele=1 (ALT='.') səhv düzəldildi.

19 fevral: --bcf GQ/DP-filtrləmə xətaları düzəldildi. --vcf və --bcf indi VCF contig adlandırma məhdudiyyətlərini tətbiq edir.

11 fevral: "--vcf-half-call arayışı" yenidən düzgün işləyir (son qurmalarda "--vcf-half-call error" kimi davranırdı).

8 Fevral: BGZF ilə sıxılmış mətn faylları indi fayl üzərində çoxsaylı keçidlər edən bütün əmrlərlə düzgün işləməlidir (əvvəllər --vcf ilə işləyirdilər, lakin bu tip başqa əmrlər demək olar ki, yoxdur). Bu əmrlərə adlanmış boru girişi indi ardıcıl olaraq səhv mesajı ilə nəticələnməlidir ki, əvvəllər bu, əbədi olaraq dayana bilərdi.

3 fevral: --missing-code indi --haps ilə düzgün işləyir.

24 Yanvar: Sabit --extract/--exclude səhvi əməliyyatlar sırasına görə daha əvvəl başqa variant filtri tətbiq edildikdə baş verə bilər (məsələn, --snps-only, --max-alleles, --extract-if-info). Bu səhv düzəlişi alfa 2-yə qaytarıldı.

21 Yanvar: "--extract range" və "--exclude range" artıq onların giriş fayllarında cari verilənlər bazasında olmayan xromosom kodu olduqda xəta olmur.

16 Yanvar: --pca alleli/variant çəkisi çoxlu iş parçacığı düzəlişi.

14 Yanvar: --make-king-table-bağ düzəlişini yenidən yoxlayın.

3 Yanvar 2020: Oktyabrın sonunda təqdim edilən --extract-if-info/--exclude-if-info rəqəmli-arqument səhvi düzəldildi.

30 dekabr 2019 (alfa 3): Bu, uyğunluğu pozan aşağıdakı potensial dəyişiklikləri edir:

    və --indep-pairwise bütün variant identifikatorlarının unikal olmasını tələb edir. --write-snplist üçün bu, 'allow-dups' dəyişdiricisini əlavə etməklə ləğv edilə bilər. REF/ALT rejiminin açıq şəkildə elan edilməsini tələb edir. ikili fenotiplər üçün defolt olaraq "birinci geri qayıtma" rejiminə keçir. Köhnə davranış 'no-firth' dəyişdiricisi ilə tələb oluna bilər.
  • Fenotip və kovariatlar arasında xətti asılılıq olduqda fenotipi atlamaq və xəbərdarlıq çap etmək əvəzinə --glm səhvləri aradan qaldırın. Köhnə davranış 'skip' modifikatoru ilə tələb oluna bilər. 'var-wts' alt əmri multiallelik variantları düzgün idarə edən 'allele-wts' ilə əvəz edilmişdir. Yalnız biallelik variantları ehtiva edən məlumat dəstləri üçün köhnə çıxış formatı hələ də "biallelic-var-wts" ilə tələb oluna bilər.
  • 50-dən az təsisçisi olan verilənlər bazasında LD hesablamasını tələb etdiyiniz zaman PLINK 2 indi səhv edir. Bu --bad-ld ilə ləğv edilə bilər. köhnə NMISS_ALLELE_CT sütunu (nhaqqındadarıxmaqing allele count) ALLELE_CT olaraq dəyişdirildi və sütun dəstinin adı müvafiq olaraq dəyişdirildi, çünki digər kontekstlərdə 'nmiss' nsayı darıxmaqdəyərləri əks etdirir, bu da mahiyyətcə bunun əksidir. 's ID <1,2>sütunlarının adı digər PLINK 2 əmrləri ilə uyğunluq üçün IID<1,2> ​​olaraq dəyişdirildi.

Bundan əlavə, GRM hesablaması ("--pca təqribən" və "--score variance-standardize" ilə birlikdə) indi bütün kiçik allelləri bir yerə yığışdırmaq əvəzinə, multiallelik variantları düzgün idarə edir --xal çoxallelik variantda hər bir allelin öz xalını təyin edə bilər və --glm VIF daşmasına səbəb olma ehtimalı az olan şəkildə kateqoriyalı kovariativləri idarə edir.

Son alfa 2 quruluşu GitHub-da qeyd edilib və növbəti bir neçə ay ərzində buradan endirilə biləcək.

29 Dekabr: Bəzi heterozigot-ikiqat-ALT multiallel variantlarının işlənməsinə təsir edən səhv və ALT2/ALT3/ və s. səbəb olan səhv düzəldildi. allel tezliklərinin bəzi hallarda düzgün işə salınmaması.

13 Dekabr: 22 Noyabr quruluşunda təqdim edilən düzəldilmiş səhv bəzi bildirilən dozaların/sayıların (məsələn, --freq-in OBS_CT sütunu) ikiqat artmasına səbəb oldu. --loop-cats səhv düzəlişləri.

28 Noyabr: Keçən ay təqdim edilən VCF yarım zənglə işləmə səhvi düzəldildi.

26 Noyabr: 16-dan çox mövzu ilə dublikat icazə verilməyən variant ID axtarışı həyata keçirildikdə segfault səbəb olan son səhv düzəldildi.

25 Noyabr: Kontiglərin sayı 16-ya çox olduqda --sort-vars segfaultuna səbəb olan səhv düzəldildi. --keep-fcol və --extract-fcol qeyri-adi adlar kimi qiymətləndirildi və adı dəyişdirildi -- keep-col-match və --extract-col-cond müvafiq olaraq (köhnə adlar hələ də bu quruluşda işləyəcək).
Onlayn sənədlər artıq demək olar ki, tamamlanıb. Yan panel axtarış qutusu işləyir.

22 Noyabr: Birinci reqressiya sürətinin yaxşılaşdırılması. "--freq counts" indi .acount faylından orijinal allel tezliklərini mükəmməl şəkildə yenidən qurmaq üçün --read-freq üçün kifayət qədər dəqiqliklə dozaları ixrac edir və bunun üçün --read-freq dəyişdirilib.

15 Noyabr: 'hide-covar' göstərilmədikdə zibil çıxışına səbəb ola biləcək "--glm cols=+err" səhvi düzəldildi. --covar-nömrə təqaüdə çıxdı (əvvəllər səhv olaraq eyni semantikaya malik olmayan --covar-col-nums-a çevrilirdi).

12 noyabr: All-vs.-all --make-king[-table] qaçışları indi MAF < 1% variantlarını daha səmərəli idarə edir. --no-input-missing-phenotype seçimi əlavə edildi. --variant-score indi ikili çıxışı dəstəkləyir.

10 Noyabr: 29 Oktyabr quruluşunda təqdim edilən 'NA'/'nan' fenotipi və ya kovariat dəyəri ilə qarşılaşdıqda seqfault yaradan düzəldilmiş səhv.

9 noyabr: --variant-score (--score-un köçürülməsi) həyata keçirildi.

4 noyabr: "--export vcf" etibarsız allel kodu xəbərdarlığı bərpa edildi.

31 Oktyabr: --split-cat-pheno 'omit-most' modifikatoru tətbiq olundu, o, --glm-in daxili variasiya-inflyasiya faktoru yoxlaması ilə 'omit-last'dan daha yaxşı işləyir və --glm kateqoriyalı kovariativlərin idarə edilməsinə keçəcək alfa 3-də bu şəkildə.

30 oktyabr: --covar-col-nums və --covar iid-only-in qarışmasına səbəb olan səhv düzəldildi. Əksər mətn daxiletmə faylları üçün daha sərt boş sətir siyasəti: onlara sonda icazə verilir (çünki bu, hər dəfə əl ilə redaktə edilmiş fayllarda olur), lakin onlara artıq başqa yerdə icazə verilmir. .pvar faylı (məsələn, 'pvar-cols=-info' ilə) yaradan zaman FILTER və/və ya INFO sütunlarının silinməsi indi müvafiq başlıq sətirlərini silir.

29 oktyabr: --q-score-range həyata keçirilir. Nömrə ilə başlayan, lakin qeyri-rəqəm məzmunu (məsələn, "-123.4abc") ehtiva edən sətirlər indi üzən nöqtəli nömrə gözlənildikdə xətaya səbəb olur.

25 Oktyabr: --make-king-table 'rel-check' modifikatoru əlavə etdi ki, bu, PLINK 1.9 --genome üçün olduğu kimi eyni təsirə malikdir. --pca 'var-wts' modifikatoru köhnəldi: datanız yalnız biallelik variantlardan ibarət olduqda və hər variant üçün yalnız bir çəki yaratmağa davam etmək istədiyiniz zaman 'biallelic-var-wts' rejiminə keçin. (Alpha 3, hər bir allel üçün bir çəki yaradan 'allele-wts' modifikatorunu təqdim edəcək, bunun əvəzinə çoxallelik variantları analitik cəhətdən düzgün şəkildə dəstəkləmək lazımdır.)

22 oktyabr: --recover-var-ids həyata keçirildi. (Bu, --set-all-var-idləri tərsinə çevirmək üçün nəzərdə tutulmuşdur.)

20 oktyabr: --sample-counts həyata keçirilir, bu, "bcftools stats"-ın -s bayrağı ilə bildirilən əsas (indel olmayan) nümunə saymalarını təmin edir və plink2 formatlı böyük verilənlər dəstləri üçün >100x sürətlidir. --extract-fcol alt sətir uyğunluqlarını dəstəkləmək üçün uzadılıb.

15 Oktyabr: 12 Oktyabr Linux konstruksiyalarında plink2-nin --extract/--exclude/--snps və oxşar variant ID filtrlərində dayanmasına səbəb olan səhv düzəldildi. TSV sütunu əsasında variantları süzgəcdən keçirən --extract-fcol tətbiq edildi (bu, PLINK 1.x --qual-score-un genişləndirilməsidir).

12 oktyabr: "--hwe 0" artıq az sayda çox aşağı HWE-p-dəyəri variantlarını silmir.

9 oktyabr: --pheno/--covar 'yalnız iid' modifikatoru əlavə edildi, başlıqsız faylları tək ID sütunu ilə dəstəkləyir. Windows BGZF sıxılması indi çoxillikdir. Təkmilləşdirilmiş oxuma xətası mesajları.

6 oktyabr: Windows - səssiz səhv düzəldilməsi. Mənbə kodu indi libzstd ilə dinamik əlaqəni dəstəkləyir (baxmayaraq ki, siz həmin kitabxananın çox yivli versiyasını qurmasanız, performans azala bilər).

4 oktyabr: --king-table-alt çoxluq + --paralel səhv düzəldilməsi. Avtomatik Zstd mətn faylı dekompressiyası indi düzgün işləməli olan 28 Sentyabr quruluşu tərəfindən bir neçə əmr üçün pozuldu.

3 Oktyabr: 28 Sentyabr quruluşunda BGZF dekompressiya səhvləri düzəldildi. (Bu, VCF &rarr .bed/.pgen çevrilməsinə təsir etmədi, baxmayaraq ki, bəzi nadir istifadə halları təsirləndi.) SID-yükləmə xətası düzəldildi.

28 Sentyabr: Qarışıq-müvəqqəti istinad səhvləri düzəlişləri. --ref-allele/--alt1-allele/--update-map/--update-name skip-count bugfix. --glm yerli-covar xəttini atlayan səhv düzəlişi. Daxil olan faylın adı çıxış faylı adına uyğunlaşdıqda avtomatik olaraq adının dəyişdirilməsi xəta yerinə yenidən düzgün işləməlidir (baxmayaraq ki, bundan hələ də çəkinmək lazımdır).

10 Sentyabr: --glm birgə test p-dəyəri səhvinin düzəldilməsi. (Bu səhv yalnız --testlərin 4 və ya daha çox proqnozlaşdırıcı ilə işə salındığı yerlərdə təsir etdi.)

26 Avqust: --read-freq indi bütün variantlar artıq süzüldükdən sonra segfaulting və ya sonsuz döngəyə daxil olmaq əvəzinə xəbərdarlıq çap edir.

21 Avqust: Saxta --ref-from-fa/--ref-allele + VCF ixrac qarşılıqlı əlaqəsi saxta "PR" INFO bayraqlarının bildirilməsinə səbəb oldu.

10 avqust: Açıq-uğursuz və yazı-uğursuz səhv mesajları indi nəyin səhv getdiyini daha ətraflı izah edir. --bgen, --data və --gen indi nə birinci, nə də sonuncu allelin ardıcıl REF olmadığını açıq şəkildə ifadə etmək üçün "ref-naməlum" dəyişdiricisinə malikdir.

31 İyul: --score, giriş faylı xətti kəsildikdə segfaulting əvəzinə səhv mesajı çap edir. Dəqiq bir kovariat müəyyən edildikdə bütün nəticələrin "NA" kimi bildirilməsinə səbəb ola biləcək nadir --glm səhvi düzəldildi. .log faylları yenidən düzgün şəkildə '--out' və '--d' çap olunur (bu, 24 iyul quruluşu ilə pozulub). --glm indi hər 'NA' əmsalının səbəbini bildirən isteğe bağlı çıxış sütununa ('səhv') malikdir.

8 iyul: --rm-dup/--sample-diff/--ld multiallelik variant səhv düzəldildi.

5 iyul: --read-freq əməliyyatlar sırasına görə adi allel tezliyi/sayma hesablamasından əvvəl köçürüldü. Yüklənmiş allel tezlikləri artıq yenidən hesablanmır.

28 İyun: --king-table-alt dəsti yenidən düzgün işləməlidir.

26 İyun: Nə 'gizlətmə', nə də 'kesmə' göstərilmədiyi zaman bir allelin iki dəfə bildirilməsinə və bir kovariat testinin bildirilməməsinə səbəb ola bilən çoxallelik-variant səhvi düzəldildi. --glm genotypic/hethom-un kovariatları olmayan seqfaultuna səbəb ola biləcək problem həll edildi.

17 İyun: --glm p-dəyəri hesablamasında təsdiqləmə uğursuzluğuna səbəb ola biləcək nadir su axını düzəldildi.

27 May: Unbroke --adjust-file. "--export ind-major-bed" performansının təkmilləşdirilməsi.

12 May: > 240 ölçülü partiyalarda qəzaya səbəb ola bilən (və ya .bed formatlı məlumatda yanlış nəticələr yarada) --glm xətti reqressiya fenotipi-toplu işlərin idarə edilməsi səhvi düzəldildi.

29 aprel: BGEN 1.2/1.3 mərhələli dozada idxal səhvləri düzəlişləri. --make-pgen + --dosage-eraase-threshold olmadan --hard-call-threshold artıq qəzaya uğramır.

28 aprel: --update-ids və --update-valideynlər üçün PLINK 2-xüsusi genişləndirmələr sadələşdirilmişdir. --id-delim/--sample-diff 'sid' dəyişdiricisi tək ayırıcı nümunə identifikatorlarının IID-SID-in --iid-sid bayrağına dəyişdirilməsi kimi şərh edilməli olduğunu təyin etmək üçün.

27 aprel: --haps 17..31 (mod 32) ilə uyğun gələn nümunə sayıları üçün səhv düzəlişi. Bu, yalnız faylın son bir neçə nümunəsinə təsir etdi, lakin əgər siz --bəlkə də əvvəlki quruluşda istifadə etmisinizsə, onu yenidən işə salmağı tövsiyə edirik. --glm logistik reqressiya 'SE' sütununun adı LOG(OR)_SE olaraq dəyişdirildi ki, bildirilən standart xətanın əmsal nisbəti vahidlərindən istifadə etmədiyini daha aydın görmək üçün ehtimal nisbəti hesabat verilərkən. --update-valideynlər həyata keçirilir.

2 aprel: chrY və MT variantlarının düzgün süzülməməsinə səbəb ola biləcək hwe səhvi düzəldildi. --glm 'pheno-ids' indi kəmiyyət fenotipləri qrupları üçün işləyir.

1 aprel: --glm without --adjust indi eyni "itkinlik nümunəsi" ilə kəmiyyət fenotipləri qruplarını aşkar edir və onları birlikdə emal edir (böyük sürət artımı ilə, lakin diqqətli olun re: disk sahəsi, yəqin ki, "gizlətmək" funksiyasından istifadə etmək istərdiniz. -covar' dəyişdiricisi, 'zs' və/və ya --pfilter də faydalı ola bilər). --glm linear regression local-covar= bugfix.

26 Mart: Minimac3-r2 hesablama səhvi düzəldildi. --glm artıq hər bir fenotip üçün istifadə edilən bütün nümunələri sadalayan .id faylları yaratmır, əgər "feno-idlər" dəyişdiricisi əlavə olunmursa. --update-ids həyata keçirilir.

23 mart: Ən çox allel sayının 6 və ya 18 olduğu fayllara təsir göstərə bilən çoxallelik variantlı yazıcı xətası düzəldildi. --minimac3-r2-filtr və --freq minimac3r2 sütunu həyata keçirilir.

18 Mart: --write-covar indi heç bir kovariat yüklənmədikdə, ən azı bir fenotip yükləndikdə və fenotip çıxışı tələb olunduqda istifadə edilə bilər.

9 Mart: plink2 --version və --help artıq sıfırdan fərqli çıxış kodlarını qaytarmır.
PGEN spesifikasiyası layihəsi artıq mövcuddur.

6 Mart: Variant filtri aktiv olduqda saxta "Səhv .pgen faylı" xətasına səbəb ola biləcək allel tezliyinin hesablanması səhvi düzəldildi.

5 mart: Çox yivli --çıxarış/--xarici.

4 Mart: --xətti reqressiya çıxışı səhvini sınayır.

3 Mart: 1 Martda təqdim edilən --glm odds-ranio çap səhvini düzəldin.

2 Mart: Daha çox kömək mətninin təmizlənməsi (indi onlayn sənədlər daxil olmaqla).

1 Mart: --recode-allele həyata keçirildi (və ardıcıllıq üçün --export-allele olaraq adlandırıldı). Boşluq ehtiva edən INFO dəyəri idxal edildikdə VCF idxalı indi səhv edir. Komanda xətti yardım mətnindəki mötərizələr indi digər alətlərə daha çox oxşar şəkildə istifadə olunur.

21 Fevral: --glm birgə testləri daha yaxşı kiçik nümunə dəqiqliyi üçün indi F-statistikasına əsaslanır.

20 Fevral: --import-dosage-certainty indi dozaj dəqiqliyi qeyri-adekvat olduqda VCF GT sahəsinə qayıtmaq əvəzinə, həmişə itkin zəng yaradır. --extract-insect bayrağı əlavə edildi.

19 fevral: --glm heç bir kovariativ olmadan yenidən düzgün işləyir (saxta "yaddaş tükəndi" xətası ilə çıxış edirdi). --import-dosage-certainty indi yalnız genotip-ehtimal üçlüləri əvəzinə, tək qiymətli dozalarda gözlənilən təsirə malikdir.

18 Fevral: Dozaj məlumatlarında qəzaya səbəb ola biləcək bir səhv düzəldildi.

14 Fevral: Komanda xətti tam parametrləri indi elmi qeyddən istifadə edə bilər.

12 Fevral: Mərhələli dozada idxal səhvi.

2 Fevral: --testlər + --parametrlərdə səhv düzəldilməsi.

31 Yanvar: --pca təqribən indi variantların sayı PC-lərin sayına nisbətən çox kiçik olduqda qeyri-dəqiq nəticələr bildirmək əvəzinə səhvlər baş verir. --pca təqribən öz dəyəri səhv düzəlişi.

30 Yanvar: --glm kovariativ miqyaslı xəta indi sirli yaddaşdan kənar xəta mesajı yaratmaq əvəzinə düzgün şəkildə yayılır.

22 Yanvar: --glm indi səhv edir və rəqəmsal qeyri-sabitliyin əsas narahatlıq doğurması üçün kovariatlar miqyasda kifayət qədər dəyişdikdə --covar-variance-standardize əlavə etməyi tövsiyə edir.

2 Yanvar 2019: Mərhələli dozada idxal səhvi.

27 Dekabr 2018: --ref-allele/--alt1-allele skipchar son bir neçə ay ərzində pozuldu, yenidən düzgün işləməlidir. Tam olmayan dozaj variantını idxal edərkən baş verən səhv düzəldildi.

28 oktyabr: --fam saxla/--fam-i sil.

2 Oktyabr: Çox uzun mətn sətirləri (məsələn, 5 MB-dan uzun VCF xətləri) yüklənərkən baş verə biləcək səhv düzəldildi.

22 Sentyabr: Variantların sıradan çıxması zamanı baş verə biləcək nadir səhv düzəldildi. --sample-diff əmri yerinə yetirildi.

12 Sentyabr: --normalize 'siyahı' dəyişdiricisi əlavə edildi.

11 Sentyabr: --rm-dup 'list' dəyişdiricisi əlavə edildi, bütün təkrarlanan variant identifikatorlarını siyahıya salmaq üçün. (Bu, müstəqil bir əmr kimi işlədilə bilər.)

9 Sentyabr: Mətn dekompressorunda giriş xətlərinin atlanmasına səbəb ola biləcək nadir yarış vəziyyəti düzəldildi. (Biz inanırıq ki, son bir neçə ay ərzində bildirilən VCF-import "Fayl oxunma uğursuzluğu" qəzalarının səbəbi bu idi.)

8 Sentyabr: Əlavə ##contig başlıq xətləri mövcud olduqda baş verə biləcək VCF-ixrac xətası düzəldildi.--sort-vars səhv düzəlişi. --normalize indi normallaşmadan sonrakı variantların sıralanmış qaydada olmadığını aşkar edir və bu halda xəbərdarlıq çap edir.

7 Sentyabr: - mərhələli multiallelik variantlar üçün səhv düzəldilməsi. --rm-dup bayrağı əlavə edildi (dublikat ID variantlarını silir, genotip/INFO/s. bərabərliyi yoxlaya bilər).

4 Sentyabr: Sabit A1_CASE_FREQ və əlaqəli sütunlar --glm çıxışında son multiallelik yeniləmə ilə pozuldu. --geno-counts və --hardy çıxışında bir neçə sütun adı təmizləndi.

31 Avqust: Sabit və bütün sabit, lakin 1 kovariatların idarə edilməsi ilə sabit --glm səhvi.

30 Avqust: AVX2 və 32-bit --export bgen-1.2/1.3 səhv düzəlişləri (əsasən itkin genotiplərə təsir göstərir). VCF 4.3 fayllarını rədd edən proqramlarla (məsələn, SNPTEST) uyğunluq üçün "--export vcf-4.2" rejimi əlavə edildi. İxrac edilmiş VCF-lər girişdə PAR1 və/və ya PAR2 olduqda indi daha uyğun ##contig başlıqlarına malik olmalıdır. Sol-normallaşdırma (--normallaşdırmaq) bayrağı əlavə edildi.

26 avqust: --pca .eigenvec başlıq xəttinin son sütunu artıq buraxılmır.

21 Avqust: Dünənki quruluşda --mac/--max-mac 'nref' və 'alt1' rejimi səhvləri düzəldildi.

20 Avqust: VCF FORMAT/GP məlumatlarını idxal etmək üçün son üç ay yarımdan hər hansı bir quruluşdan istifadə etmisinizsə, 7 Mayda təqdim edilən "--vcf dozası=GP" səhvi düzəldildi, daha yeni quruluşla yenidən işə salın. Faylda FORMAT/DS sahəsi olanda "--vcf dosage=GP" indi uyğun mesajla səhv edir və GP sahəsinin idxalının mümkün ola biləcəyi nadir halları əhatə etmək üçün "dosage=GP-force" seçimi əlavə edilib. yenə də dəyərli olsun. --maf/--max-maf/--mac/--max-mac indi sizə əsas olmayan (standart), qeyri-istinad, alt1 və ya kiçik allel tezlikləri/sayları üzrə filtrləmə imkanı verir, bunun üçün bcftools qeydindən istifadə edə bilərsiniz (məs. "--min-af 0.01:minor"), lakin fərqli standartı yadda saxlayın.

18 avqust: plink2 formatlı 1000 Genom faza 3 faylları, mərhələli haplotiplər və annotasiyalar və rəsmi nəsildə bir neçə düzəliş (KING-möhkəm təhlili ilə müəyyən edilir) indi Resurslar səhifəsindən endirilə bilər. --king-cutoff indi başlıq xətti olan nümunə ID fayllarını idarə edə bilər.

16 Avqust: --glm logistik reqressiya indi çoxallelik variantları dəstəkləyir. Dünənki quruluşda --glm xətti-reqressiya dozası ilə bağlı səhv düzəldildi.

15 Avqust: --glm xətti reqressiya indi çoxallelik variantları dəstəkləyir. --ld səhv düzəldilməsi. --parameters + "--glm interaction" indi kovariat yalnız qarşılıqlı əlaqənin bir hissəsi kimi iştirak etdikdə düzgün işləyir.

9 avqust: --make-king[-table] singleton/monomorphic-variant optimallaşdırılması həyata keçirildi.

7 Avqust: GRM quruluşu və --missing artıq multiallel məlumatlarla pozulmur.

6 Avqust: VCF multiallel (fazalı) idxal və ixrac həyata keçirildi. --hwe indi multiallelik variantlar üçün hər bir alleli ayrıca sınaqdan keçirir. --min-alleles/--max-alleles filtrləmə bayraqları əlavə edildi.
(--glm çoxallelik variantları dəstəkləmir, hələ ki, yeniləmə gələn həftə üçün planlaşdırılır.)

30 iyul: --vcf-max-dp bayrağı əlavə edildi.

26 İyul: --vcf-half-call indi mərhələsiz məlumatlar üzərində düzgün işləməlidir.

25 İyul: İstənməyən sərt zəng həddini işə sala bilən --sort-vars/low-memory-make-pgen dozası ilə bağlı səhv düzəldildi. Dozaj məlumatları ilə işləmək üçün 14 aprel - 19 iyul 2018-ci il tarixləri arasında qurulmadan istifadə etmisinizsə, sərt zənglər düzgün həddə çatmamış ola bilər. Təsirə məruz qalan quruluş tərəfindən idxal edilmiş filtrlənməmiş dozaj data setləri --make-pgen + açıq --hard-call-threshold işləməklə düzəldilə bilər. --geno/--mind kimi sərt zəng əsaslı filtrlər yenidən işə salınmalıdır (sərt zənglər düzəldildikdən sonra).

19 iyul: --update-alleles həyata keçirilir.

16 iyul: Daha çox yivli-VCF-parse debug giriş kodu əlavə edildi.

13 iyul: --make-king/--make-grm/--pca-da chrX/Y/MT avtomatik aradan qaldırılması səhvi düzəldildi.

12 iyul: Unbroke --mach-r2-filtr.

3 iyul: .fam/.psam faylları indi yalnız IID sütunu tələb edildikdə və ya mövcud olduqda düzgün yüklənir.

29 İyun: daha çox olan .bim/.pvar faylları

134 milyon variant yenidən düzgün yüklənir (kifayət qədər yaddaş nəzərə alınmaqla).

25 İyun: Mayın 30-da pozulmuş bir neçə tək nümunəli ixrac halı düzəldildi.

22 İyun: 19-20 İyun quruluşlarında pozulmuş bir neçə log mesajı düzəldildi. Davam edən çoxillikli-VCF-dozajı-idxal səhv araşdırmasını dəstəkləmək üçün əlavə çap edilmiş debug-çap kodu (əgər VCF idxalı zamanı sirli "Fayl oxunma uğursuzluğu" səhvləri və ya nəticəni oxuyarkən "--threads" əlavə edərək "Səhv .pgen" xətaları ilə qarşılaşırsınızsa 1" VCF-import əmrinizə, yəqin ki, dərhal probleminizi həll edəcək, lakin siz də mənə uğursuz çox yivli qaçışdan (və ya daha yaxşı, test məlumatlarından) bir .log faylı göndərə bilsəniz, bu çox faydalı olardı).

20 İyun: 30 Mayda təqdim edilən GRM/PCA/bal hesablama səhvini düzəldin. GRM/--pca/--score üçün 30 May və ya iyunun əvvəlində qurulmuş versiyadan istifadə etmisinizsə, xətaya görə üzr istəyirik.

19 İyun: İtkin allel çox uzun bir allellə əvəz edildikdə baş verə biləcək nadir --ref-allele/--alt1-allele künc halı düzəldildi.

5 İyun: VCF idxal edilməmiş dəyişən səhv düzəlişi. --score 'görməzlik-dup-ids' dəyişdiricisi əlavə edildi.

30 May: "--export haps[legend]" səhv düzəlişləri və bgzip dəstəyi. "--export vcf vcf-dosage=DS" faza məlumatı mövcud olduqda artıq elan olunmamış HDS dəyərlərini ixrac etmir. Unbreak --import-dosage + --map, bu dəfə real.

21 May: --pgen-info əmri əlavə edildi (bir .pgen faylı haqqında əsas məlumatları, məsələn, onun faza və ya doza məlumatı olub-olmadığını göstərir).

17 May: --import-dosage və .gen idxalı son bir neçə həftə ərzində pozuldu, bu, indi düzəldilməlidir. A1 sütunu multiallelik variantlara hazırlıq üçün --adjust çıxışına əlavə edildi. --glm 'a0-ref' dəyişdiricisinin adı 'omit-ref' olaraq dəyişdirildi.

15 May: Dozalar mövcud olduqda chrX allel tezliyinin hesablanması səhvi düzəldildi. --ld, multiallelik variantlarla daha yaxşı oynamaq üçün istinad allelləri əvəzinə majora əsaslanmaq üçün dəyişdirildi. --hardy başlıq xətti və allel sütunları multiallelik variant dəstəyinə hazırlıq üçün dəyişdirildi.

8 May: --vcf dosage=HDS indi DS sahəsi olmayan faylları düzgün idarə etməlidir.

7 May: Sabit nadir I/O dalana dirəndi. Təkmilləşdirilmiş VCF-import paralelliyi.

4 May: Dozaj dəqiqliyi bitləri 8-ə çox olmadıqda sabit --bgen idxal/ixrac (əvvəllər bu hallar üçün spesifikasiyanı səhv şərh etmişdilər, buna görə üzr istəyirik).

3 May: --bgen indi 28 bit dozaj dəqiqliyi ilə variant qeydlərini idxal edə bilər (baxmayaraq ki, yalnız

15 bit sağ qalacaq). "--export vcf-dosage=HDS-force" səhvini düzəltmək.

2 May: --vcf dosage= import artıq GT sahəsinin olmasını tələb etmir. Sabit potensial --vcf dozası=HDS bufer daşması.

28 aprel: Otosomlar və cinsi xromosom(lar)ın hər ikisi mövcud olduqda və ya hər ikisi chrX və chrY olduqda meydana gələn --glm səhvi düzəldildi. Əgər siz 9 Fevral 2018-ci il və ya daha sonrakı versiya ilə bütün genomlu --glm runını həyata keçirmisinizsə, ən son quruluşla yenidən işləməlisiniz. Bununla belə, tək xromosomlu və yalnız autosomlu --glm qaçışları səhvdən təsirlənmədi.

24 aprel: VCF mərhələli doza idxalı ("--vcf dosage=HDS") və ixracı ("--export vcf vcf-dosage=HDS"). --pca və GRM hesablamaları indi bütün haploid genomlar üçün düzgün variasiyadan istifadə edir.

22 aprel: --export bgen-1.2/bgen-1.3 indi chrX/chrY/chrM üçün işləməlidir, həmçinin həmin xromosomlar üçün idxal səhvlərini də düzəltdi.

16 aprel: --ref-from-fa contig line təhlili səhv düzəlişi.

14 aprel: --export bgen-1.2/bgen-1.3 autosomal diploid data üçün həyata keçirilir. Layiqli allel tezlikləri tələb edən --pca kimi əməliyyatlar, --bad-freqs bayrağını əlavə etməsəniz, tezliklər 50-dən az nümunədən təxmin edilən zaman xəta baş verir. Mərhələli dozaj dəstəyi həyata keçirilir. Eksport edilmiş .nümunə fayllarında nümunə çatışmamazlığı dərəcəsi indi sərt zənglərdən daha çox dozalara əsaslanır. Qeyri-AVX2 faza alt quraşdırma səhvi düzəliş. --vcf + --psam səhvini düzəltmək. --vcf dosage= indi bunun əvəzinə doza mövcud olduqda sərt çağırışa məhəl qoymur, o, --hard-call-threshold 0.1 altında bərpa olunur (fərqli həddi qeyd etməsəniz). --bgen 'ref-second' dəyişdiricisinin adı multiallel variantları üçün düzgün şəkildə ümumiləşdirmək üçün 'ref-last' olaraq dəyişdirildi.

31 Mart: --export haps[əfsanə] indi düzgün işləməlidir zaman --ref-allele/--ref-from-fa/etc. eyni qaçışda bəzi allelləri çevirir.

29 mart: --set--var-ids qeyri-AVX2 səhv düzəlişi. --pheno/--covar autonaming bugfix.

28 Mart: --bgen 1-bit mərhələli haplotip idxalı həyata keçirildi.

26 Mart: --yataq-yataq + --indiv-sort səhvi düzəldin.

23 Mart: Windows quruluşları yenidən düzgün işləməlidir (20-21 Mart Windows quruluşları pis şəkildə pozuldu). --glm indi log-pvalue çıxışını dəstəkləyir ('log10' modifikatorunu əlavə edin) və bunlar p=5e-324 olan ikiqat dəqiqlikli üzən nöqtə limitinin altında dəqiq olaraq qalır.

21 mart: 3 sütunlu .nümunə faylının yüklənməsi yenidən düzgün işləyir. Fayl oxuma yarışı vəziyyəti düzəldildi.

20 Mart: Çox uzun xətləri yükləyərkən son tikililərdə mümkün çıxılmazlığı aradan qaldırın.

19 Mart: Düzəlt - son qurulmalarda nümunə segfault. .bgen idxal/ixrac sürətinin yaxşılaşdırılması. --oxford-single-chr 4 Mart quruluşunda düzgün uzadılmadı, bu indi düzəldilməlidir.

11 Mart: Faylın başlıq xətti olmadığı zaman baş verə biləcək keçən həftə quruluşlarında --pheno segfault-u düzəldin.

9 Mart: Tək yazma əməliyyatı 2 GB-dan böyük olduqda baş verən "Fayl yazma xətası" səhvini düzəldin (bu, 128k-dan çox nümunə ilə --make-bed işləyərkən baş verə bilər). Azaldılmış --yataq üçün yaddaş tələbi.

7 Mart: Son qurulmalarda (23 Fevral və ya daha sonra) faylların oxunması ilə bağlı problem həll edildi.

5 mart: --glm local-covar= yenidən düzgün işləməlidir.

4 Mart: --oxford-single-chr artıq .bgen fayllarında istifadə edilə bilər. --make-pgen qismən-mərhələli məlumatların işlənməsi ilə bağlı səhv düzəlişi.

26 fevral: --saxla/--sil/və s. başlıq xətti olmayan yalnız IID fayllarında indi düzgün işləməlidir.

23 Fevral: Sabit alfa 2 --vcf + --id-delim səhvi. Sıxılmış VCF və .pvar faylları üçün təkmilləşdirilmiş təhlil sürəti.

20 fevral: "--xchr-model 1" indi düzgün işləməlidir.

16 Fevral 2018 (alfa 2): Bu, uyğunluğu pozan aşağıdakı potensial dəyişiklikləri edir:

  • FID indi isteğe bağlı sahədir: əgər o, giriş .psam faylında deyilsə, defolt olaraq bir neçə çıxış faylından çıxarılıb (indi bunlarda "maybefid" və "fid" sütun dəstləri var, burada defolt dəstdə "maybefid" var) , və FID dəyərləri tələb edən hər hansı əməliyyatla (məsələn, --make-bed) həmişə-'0' kimi qəbul edilir. Genomik məlumat fayllarını ixrac edərkən, bütün qalan dəyərlər '0' olarsa, 'maybefid' də sütunu itkin hesab edir.
  • Müvafiq olaraq, VCF və ya .bgen faylından nümunə identifikatorlarını idxal edərkən, defolt rejim indi "--const-fid 0"dır və heç bir FID sütunu diskə yazılmayacaq. --keep, --remove və oxşar əmrlər də indi giriş sətirində yalnız bir işarə olduqda "--const-fid 0" semantikasına malikdir. İndi IID yeganə nümunə ID komponenti kimi hərəkət edə bilərsiniz, əgər iş axınınız üçün ən mənalı olan budur. Əksinə, VCF/.bgen nümunə identifikatorlarını çoxsaylı komponentlərə bölmək istədiyiniz zaman --id-delim-dən açıq şəkildə istifadə etmək lazımdır.
  • MT yenidən haploid xromosom kimi müalicə olunur. PLINK 1.9 və daha əvvəlki plink2 quruluşlarında, nəticədə heteroplazmatik mutasiyalar, --glm(/--linear/--logistic) genotip sütunu və "--freq" kimi əmrlər haqqında məlumatı atmamaq üçün MT diploid-ish kimi qəbul edilirdi. sayar” 0..2 miqyasından istifadə etdi. İndi plink2 dozalar üçün lazımi dəstəyə malikdir, bu çamur artıq lazım deyil.
  • --glm-in 't' sütun dəsti xətti reqressiya üçün T-statistikası, logistik/Firth üçün isə Wald Z-balı olduğunu əks etdirmək üçün 'tz' olaraq dəyişdirildi. .glm.logistic[.hybrid] və .glm.firth fayllarında müvafiq sütunun başlıq xəttində indi "Z_STAT" var.

Həmçinin, --glm indi defolt olaraq ALT allel dozaları əvəzinə kiçik ölçüdə reqressiya edir (bu, 'a0-ref' ilə ləğv edilə bilər).

Son alfa 1 quruluşu GitHub-da işarələnib və növbəti bir neçə ay ərzində buradan endirilə biləcək.

11 Fevral: .king.cutoff.in/.king.cutoff.out faylları indi nümunə identifikatorları olan və başqa məlumat olmayan digər çıxış faylları ilə uyğunluq üçün .id ilə bitir. Eynilə, --mind-in çıxış faylı artıq .mindrem.id uzantısına malikdir və defolt olaraq başlıq xəttinə malikdir. İndi bütün .id çıxış fayllarında başlıq xəttini sıxışdırmaq (və sütunları FID/IID olmağa məcbur etmək) üçün --no-id-header istifadə edə bilərsiniz.

10 fevral: --update-sex 'male0' seçimi əlavə edildi və xüsusi sütun seçim interfeysi dəyişdirildi (indi 'col-num='). --glm 'gcountcc' sütun adları yeniləndi (indi 'CASE_NON_A1_CT', 'CASE_HET_A1_CT' və s.) A1=əsas allele keçməyə hazırlanır. --make-just-pvar + --ref-allele/--ref-from-fa .pvar girişində başlıq xətti olduqda artıq bütün ilkin istinad allellərini müvəqqəti hesab etmir.

9 Fevral: Belə dəyərlər yüklənmədikdə .pvar QUAL/FILTER çıxışının məcbur edilməsi artıq segfault yaratmır.

5 Fevral: AVX2 faza-alt quraşdırma səhvi.

3 fevral: --hesab 'dominant' və 'resessiv' dəyişdiricilər əlavə edildi.

30 Yanvar: Variantların sayı 64-ə çox olduqda və nümunələrin sayı çox olduqda baş verən .pgen yazı səhvini düzəldin.

24 Yanvar: "--export oxford" indi bgzipped çıxışı dəstəkləyir.

21 Yanvar: --glm indi həmişə hansı allel(lər)in müsbət genotip sütun qiymətlərinə uyğun olduğunu göstərən əlavə 'A1' sütunu bildirir. --glm sütun dəstləri ALT əvəzinə A1 ətrafında fırlanmaq üçün dəyişdirilib, ona görə də bu quruluşa keçərkən kiçik skript dəyişiklikləri lazım ola bilər.
Bu quruluşda A1 və ALT hələ də sinonimdir. Bu, alfa 2-də dəyişəcək: A1, multikollinearlığı azaltmaq (--keep-allele-order olmadıqda PLINK 1.x-in davranışını təqlid etmək) üçün defolt olaraq kiçik allel(lər)ə keçəcək, baxmayaraq ki, sizin hələ də A1-i məcbur etmək seçiminiz olacaq. =ALT.

12 Yanvar: Ardıcıl çoxlu variantlarda heç bir itkin zəng olmadıqda meydana gələn "--glm qarşılıqlı əlaqə" səhvi düzəldildi. Biz 27 noyabr 2017-ci il və 10 yanvar 2018-ci il tarixləri daxil olmaqla, istehsal edilmiş quruluşla yerinə yetirilən "qarşılıqlı əlaqə" dəyişdiricisi ilə bütün --glm əməliyyatlarını yenidən etməyi tövsiyə edirik.

10 Yanvar: --adjust-file həyata keçirildi (hər hansı assosiasiya təhlili faylında --adjust-un çoxsaylı sınaq korreksiyasını həyata keçirir).

9 Yanvar: Bir neçə əmrə 'no-idheader' dəyişdiriciləri əlavə edildi və qarşılıqlı fəaliyyətin pozulmasının qarşısını almaq üçün bunu --make-grm-bin/--make-grm-list üçün defolt etdi.

7 Yanvar: --vcf-ə indi yalnız saytlar üçün VCF verilə bilər ki, iş genotip məlumatı tələb etmir. Nümunə ID faylları, məsələn --write-samples tərəfindən istehsal olunanlar, indi defolt olaraq başlıq xəttini ehtiva edir, bu, gələcəkdə FID-IID və IID-SID çıxışını ayırd etmək üçün lazım olacaq. (--write-samples ilə siz 'noheader' dəyişdiricisini əlavə etməklə başlıq xəttini sıxışdıra bilərsiniz.)

5 Yanvar: --pheno-col-nums/--covar-col-nums həyata keçirildi.

2 Yanvar 2018: --keep-fcol (PLINK 1.x --filterə ekvivalent) həyata keçirildi.

19 dekabr 2017-ci il: --tənzimləmə həyata keçirildi. --zst səviyyəli həyata keçirilir (Zstd sıxılma səviyyəsinə nəzarət etməyə imkan verir). Un-broke - təkrar.

18 dekabr: --extract/--exclude indi birbaşa UCSC interval-BED fayllarında istifadə edilə bilər (yaxşı ki, koordinatlar 0-a əsaslansın və ya 4-cü sütun olmasın). "--output-chr 26" indi əlifba xromosom kodlarını idarə edə bilməyən ADMIXTURE kimi proqramlarla qarşılıqlı əlaqəni bərpa etmək üçün PAR1/PAR2-nin "25" (insanlar üçün) kimi göstərilməsinə səbəb olur. --merge-x həyata keçirilir (adətən indi --sort-vars ilə birləşdirilməlidir). --pvar adətən indi "yalnız saytlar üçün" VCF fayllarını (məsələn, gnomAD layihəsi tərəfindən buraxılanları) idarə edə bilər. --nazik, --nazik-sayma, --nazik-indiv və --nazik-indiv-sayma həyata keçirilir.

16 dekabr: Çox yivli zstd sıxılma tətbiq olundu (Linux və macOS-da). --make-grm-gz --make-grm-list olaraq dəyişdirildi və gzip rejimi silindi.

15 dekabr: Rəqəmlə başlayan qeyri-rəqəmli dəyərlər üçün --extract-if-info və --exclude-if-info-nun davranışı düzəldildi. Mövcudluğu yoxlayan bayraqların adı ardıcıllıq üçün --məlumat tələb edir və --məlumat tələb edir.

13 dekabr: INFO açar/dəyər cütləri və ya açar mövcudluğu üzrə sadə filtrləmə üçün --extract-if-info və --exclude-if-info bayraqları əlavə edildi.

11 dekabr: --king-table-alt dəst bayrağı əlavə edildi. Bu, iki mərhələli əlaqənin/dublikatın aşkarlanmasının həyata keçirilməsini asanlaşdırır: genom üzrə səpələnmiş az sayda yüksək MAF variantlarında --make-king-table ilə başlayın və sonra onu --king-table-alt dəsti ilə yenidən işə salın. birinci mərhələdən namizəd nümunə cütlərinin müvafiq alt çoxluğu. --bp-space həyata keçirildi (yuxarıdakı birinci mərhələ üçün faydalıdır).
İki mərhələli iş axını ilk dəfə KING-in son versiyasında Wei-Min Chen tərəfindən həyata keçirildi və sitat məlumatı üçün onunla əlaqə saxlayın.

7 dekabr: Mərhələli verilənlər toplusundan nümunələri süzərkən baş verə biləcək səhv düzəldildi. Windows AVX2 qurması artıq mövcuddur.

28 Noyabr: --import-dosage 'format=infer' (bu, indi standartdır) və 'id-delim=' ("--export A-transpose" məlumatlarının yenidən idxalı üçün lazımdır) seçimləri əlavə edildi. Format=1 altında itkin genotiplərdə səhvə səbəb olan --import-dosage səhvi düzəldildi. --no-psam-pheno (və ya --no-pheno/--no-fam-pheno) indi fenotip(ləri) --pheno faylında saxlamaqla, nümunə faylındakı bütün fenotiplərə məhəl qoymamaq üçün istifadə edilə bilər. biri dəqiqləşdirildi.

27 Noyabr: --glm no-missing-genotype halı üçün sürətli yol tətbiq edildi (əsasən xətti reqressiyaya təsir göstərir). --make-king[-table] indi --parallel istifadə etmədən yaddaşa sığmaq üçün çox böyük matrisləri avtomatik idarə edə bilər. AVX2 nümunə filtrləmə performansının təkmilləşdirilməsi. --bağ düzəlişini doğrulayın.

19 Noyabr: 14 Noyabr quruluşunda təqdim edilən VCF FORMAT/GT başlıq xəttinin təhlili səhvini düzəldin.

18 noyabr: --make-king[-table] performans təkmilləşdirmələri.

16 Noyabr: 14 Noyabr quruluşunda ##chrSet başlıq xəttinin təhlilini pozan səhv düzəldildi.

14 noyabr: --export-a səbəb olan səhv düzəldildi variantların sayı 65 ilə minə yaxın olanda asmaq.

4 Noyabr: Linux və macOS-un əvvəlcədən qurulmuş AVX2 ikili faylları indi mövcuddur, bunlar son 4 il ərzində qurulmuş əksər maşınlarda yaxşı işləməlidir. Başqa bir Firth reqressiya saxta NA səhvi düzəldildi. Nümunə filtr(lər)i eyni vaxtda tətbiq edildikdə baş vermiş xal səhvi düzəldildi. --ld mərhələli-hardcall idarə səhvi düzəldildi. Massiv-popcount təkmilləşdirilməsi davam edir (Wojciech Muła, Nathan Kurz, Daniel Lemire və Kim Walisch-in son işi sayəsində).

3 noyabr: Sabit çox keçid - ixrac səhv. --dummy dosage-freq= indi --hard-call-threshold açıq şəkildə göstərilmədikdə, standart --hard-call-threshold cutoff 0.1 ilə sərt zəngləri doldurur.

2 noyabr: --ixrac həyata keçirilir (doza dəstəyi ilə). --dummy dosage-freq= modifikatoru indi 0,75-dən yuxarı olan dozaj tezlikləri üçün düzgün işləyir.

16 oktyabr: FASTA faylından istinad allelləri təyin etmək üçün --ref-from-fa bayrağı tətbiq olundu. (Qeyd edək ki, bu, uzunluq dəyişikliyi zamanı hansı allelin istinad olduğunu müəyyən edə bilməz, lakin o, həmişə SNP-lər və çoxnukleotid polimorfizmləri üçün işləməlidir.) --update-name həyata keçirilir. 13 Oktyabr quruluşunda sütun dəsti təhlil səhvi düzəldildi.

13 oktyabr: Saxta --glm logistic/Birinci reqressiya səhvi, saxta NA nəticələri verə bilər.

9 Oktyabr: Sabit --ld-nin bəzi dozaj və haploid hallarla işləməsi. Kiçik variant alt dəstini çıxararkən --make-pgen-in faza/doz məlumatlarını ləğv etməsinə səbəb ola biləcək səhv düzəldildi. --geno-counts artıq chrY saylarını ikiqat hesabat vermir.

8 Oktyabr: --ld həyata keçirilir, mərhələli genotiplər və dozalar üçün dəstəklənir ("--ld <var1> <var2> dozajı" cəhd edin). Mövzuların sayı variantların sayından çox olduqda işə salınan kiçik bgen-1.1 idxal səhvi düzəldildi.Alel tezliyinin hesablanması artıq dozalar mövcud olduqda chrX-də qəzaya uğramır, lakin yalnız sərt zənglər lazımdır.

1 oktyabr: Həm dozalar, həm də çatışmayan dəyərlər mövcud olduqda bəzən səhvlərə səbəb olan GRM hesablama səhvi düzəldildi. --glm indi bir çox kovariativlər olduqda bir az daha sürətli olur.

20 Sentyabr: Birinci reqressiya Hessian matrisinin inversiya pilləsi ikiqat dəqiqliyə qaldırıldı, keçən həftə qurmalar tək dəqiqlikli inversiyanın etibarsız ola biləcəyini aşkar etdikdən sonra.

15 Sentyabr: --vif/--max-corr hər variantda yoxlamalar indi işləyir. Logistik reqressiya zamanı bunlar artıq atlanmır.

8 Sentyabr: Alternativ VCF INFO/PR sahələrinə artıq icazə verilir. Dünənki --make-pgen-i yavaşlatan sazlama kodu silindi.

7 Sentyabr: --başlatılmamış yaddaş səhvinin düzəldilməsi hesab. Qismən mərhələli məlumatların işlənməsi ilə bağlı səhv düzəlişi.

6 Sentyabr: macOS yığınının ölçüsü ilə bağlı problemi həll edin (--pca və bəzi digər əmrlərin son qurmalarda sıradan çıxmasına səbəb ola bilər, 1 sentyabr quruluşunda natamam həll yolu var idi).

4 Sentyabr: --[covar-]variance-standartlaşdırma çatışmayan dəyərlə işləmə səhvini düzəldin. --ref-allele/--alt1-allele həyata keçirilir (--a2-allele və --a1-allele ləqəb kimi qəbul edilir).

1 sentyabr: ---kvantil-normallaşdırmaq itkin-fenotip baxılması bugfix.

29 Avqust: --glm 'gcountcc' sütun dəsti seçimi əlavə edildi (iş/nəzarət statusu ilə təbəqələşdirilmiş genotip sərt çağırış sayları haqqında hesabat verir). --write-samples əmri əlavə edildi (analoqu --write-snplist).

2 avqust: --sort-vars həyata keçirildi.

25 iyul: --loop-cats indi genotip əsaslı variant filtrləri ilə düzgün işləyir.

24 İyul: 4 İyun quruluşunda təqdim edilən "--pca təqribən" allel tezliyi ilə bağlı səhv düzəldildi, təsirlənmiş quruluşla yerinə yetirilən hər hansı "--pca təqribən" qaçışları yenidən etməyi tövsiyə edirik. (Adi --pca təsir etmədi.) --loop-cats həyata keçirildi (PLINK 1.x --loop-assoc-a bənzər, yalnız assosiasiya testləri ilə məhdudlaşmır). VCF ixracı indi "vcf-dosage=DS-force" rejimini dəstəkləyir. --dummy multithread + dozaj səhvi.

17 iyul: BGEN v1.2/1.3 idxalçı yaddaşının ayrılması ilə bağlı səhv düzəlişi. Uğursuz ayırmanın ölçüsü indi yaddaşda olmayan xətaların əksəriyyətində qeyd olunur.

2 İyul: BGEN v1.2/1.3 idxalçısında təkmilləşdirilmiş çoxilliklər. Python yazıçısı indi eyni anda bir neçə variantla çağırıla bilər.

25 İyun: Əsas BGEN v1.2/1.3 idxalı (Böyük Britaniya Biobankının əsas məlumat buraxılışı üçün mərhələsiz bialel dozaları kifayətdir). --warning-errcode bayrağı əlavə edildi (ən azı bir xəbərdarlıq çap edildikdə, çıxış zamanı OS-yə xəta kodunun qaytarılmasına səbəb olur).

20 İyun: --condition-list + variant filter bugfix.

5 İyun: --make-pgen yaddaş tələbi çox azaldı. Bitmə vaxtı indi əksər hallarda konsolda çap olunur.

4 İyun: --hwe chrX mövcud olduqda və gender məlumatı olmadıqda artıq segfault səbəb olmur. Sabit --dummy səhv.

29 May: --import-dosage format=1 bugfix.

26 May: --glm 'standard-beta' dəyişdiricisi --variance-standardize bayrağı ilə əvəz olundu. --kvantil-normallaşdırma funksiyası əlavə edildi. Cinsiyyətsiz allellərin hesablanması səhvi düzəldildi.

25 May: --hardy/--hwe chrX mövcud olduqda yenidən düzgün işləyir, lakin verilənlər bazasının əvvəlində deyil.

22 May: Sabit əsas dozaj məlumatları + nümunə filtri səhvi biz həm dozaj məlumatları, həm də əvvəlki plink2 quruluşları ilə həyata keçirilən nümunə filtrləməsi ilə bağlı istənilən əməliyyatı yenidən icra etməyi tövsiyə edirik. --score 'list-variants' dəyişdirici əlavə edildi.

19 May: Nümunə filtr(lər)i tətbiq edildikdə dozaj məlumatlarında allel tezliyinin hesablanması ilə bağlı səhv düzəldildi.

18 May: Bir çox kateqoriyalı fenotipi idarə edən bayraqlar (--within, --keep-cats, --split-cat-pheno, . ) tətbiq olundu. Əsas fenotipə əsaslanan filtrləmə həyata keçirilmişdir (məsələn, "--remove-if PHENO1 '>' 2.5" qeyd edin ki, adsız fenotiplərə 'PHENO1', 'PHENO2' və s. adlar verilir və '<' və '>' simvolları əksər qabıqlarda sitat gətirilməlidir). --write-covar həyata keçirilir. --mach-r2-filtr tətbiq edildi və xam MaCH r 2 dəyərləri "--freq cols=+machr2" ilə atlana bilər.

11 May: --condition[-list] + --covar bugfix.

8 May: 6 May quruluşunda təqdim edilən kəmiyyət fenotip/kovariativ yükləmə səhvini düzəldin.

7 May: --import-dosage həyata keçirilir.

6 May: İkili fenotiplər üçün çatışmayan '0' əvəzinə nəzarət kimi qəbul edilməsinə səbəb olan səhv düzəldildi. Multiallelik məlumatlara hazırlıq üçün --glm-in sütun başlıqlarına kiçik dəyişiklik.

2 May: --hesab xətalarının düzəldilməsi. --maj-ref səhv düzəldilməsi. --vcf-min-dp və "--export A-transpose" həyata keçirilir.

1 May: VCF dozası idxal/ixrac, --vcf-min-gq və --read-freq həyata keçirilir. --score indi standart səhvlərlə işləyə bilər. --autosome[-par] indi düzgün işləyir. HardyWeinberg R paketinə daxil edilməsini təmin etmək üçün SNPHWE2 və SNPHWEX funksiyaları GPL-2+ kimi yenidən lisenziyalaşdırılıb.

20 aprel: .nümunə ixrac səhvi (fayl 256 KB-dən çox olarsa və heç bir fenotip mövcud deyilsə, işləmədi). --dummy həyata keçirilir (indi dozalar yarada bilər).

19 aprel: --hardy/--hwe chrX səhv düzəlişi (problemi tutduğuna və düzəlişi təsdiq etdiyinə görə Jan Graffelmana təşəkkür edirik). --new-id-max-allele-len-in indi üç rejimi var ('xəta', 'əskik' və 'kəsmə'), və defolt rejim indi "səhvdir" (yəni --set-missing-var-ids və --set-all-var-ids indi səssizcə kəsilmək əvəzinə 23 simvoldan uzun allel kodu ilə qarşılaşdıqda xəta verir). --hesab yerinə yetirildi və variasiya-normallaşdırma və çoxsaylı xal sütunlarını dəstəkləmək üçün genişləndirildi (bu iki xüsusiyyət yeni nümunələri əvvəllər hesablanmış əsas komponentlərə layihələndirmək üçün sadə bir yol təqdim edir).

11 aprel: --pca var-wts bugfix və --pca eigenvalue ordering bugfix. --glm xətti reqressiya və --condition[-list] dəstəyi əlavə edildi. --geno/--mind/--missing/--genotyping-rate indi yalnız itkin sərt zənglər əvəzinə itkin dozalara istinad edə bilər (qeyd edək ki, dozaj məlumatlarını idxal edərkən, dozalar (0.1, 0.9) və (1.1, 1.9) yadda saxlanılır, lakin adətən bağlı sərt zənglər olmayacaq).


İFADƏLƏRİ

Bu filtrləmə ifadələri əksər əmrlər tərəfindən qəbul edilir.

Etibarlı ifadələr aşağıdakıları ehtiva edə bilər:

ədədi sabitlər, sətir sabitləri, fayl adları (hazırda bu, yalnız ID sütunu ilə filtrləmək üçün dəstəklənir)

". "/i" əlavə edilmədiyi halda ifadələr hərflərə həssasdır.

məntiqi operatorlar. Həmçinin aşağıdakı nümunələrə və "&&" vs "&" və "||" arasındakı fərq haqqında filtrləmə təlimatına baxın. qarşı "|".

INFO teqləri, FORMAT teqləri, sütun adları

1.11-dən başlayaraq FİLTƏ sütunu aşağıdakı kimi sorğulana bilər:

1 (və ya 0) bayrağın mövcudluğunu (və ya olmamasını) yoxlamaq üçün

itkin genotiplər bu ifadələrdən istifadə etməklə faza və ploidiyadan (".|.", "./.", ".", "0|.") asılı olmayaraq uyğunlaşdırıla bilər.

itkin genotiplər bu ifadələrdən istifadə etməklə faza və ploidiya (".|.", "./.", ".") daxil olmaqla uyğunlaşdırıla bilər.

nümunə genotip: istinad (haploid və ya diploid), alternativ (hom və ya het, haploid və ya diploid), çatışmayan genotip, homozigot, heterozigot, haploid, ref-ref hom, alt-alt hom, ref-alt het, alt-alt het, haploid ref, haploid alt (hərf hərflərə həssas deyil)

REF,ALT sütunlarında variant növü üçün TYPE (indel,snp,mnp,ref,bnd,digər, üst-üstə düşür). Regex operatorundan istifadə edin "

" verilmiş növün ən azı bir alleli və ya bərabər işarəsi " literallayout">TYPE="snp" TYPE tələb etmək

massiv alt yazıları (0 əsaslı), hər hansı element üçün "*", diapazonu göstərmək üçün "-". Qeyd edək ki, FORMAT vektorlarını sorğulamaq üçün aşağıdakı nümunələrdə göstərildiyi kimi iki nöqtə ":" vektorun nümunəsini və elementini seçmək üçün istifadə edilə bilər.

bir çox nümunə ilə nümunə adları, hər sətirə bir nümunə adı olan bir fayl təqdim etmək daha praktik ola bilər

FORMAT teqlərində (nümunələr üzərində) və INFO teqlərində (vektor sahələri üzərində) funksiya: maksimum minimum arifmetik orta (AVG MEAN ilə sinonimdir) orta cəmi sətir uzunluğundan orta standart kənarlaşma elementlərin mütləq dəyəri:

Qeyd edək ki, yuxarıdakı funksiyalar bütün nümunələr üzrə vahid dəyərə görə qiymətləndirir və hətta FORMAT teqlərində tətbiq edildikdə nümunələri deyil, saytları seçmək üçün nəzərdə tutulub. Bununla belə, SMPL_ (və ya qısalıq üçün "s", məsələn, SMPL_MAX və ya sMAX) ilə prefiks qoyulduqda, FORMAT teqlərində tətbiq edildikdə, hər bir nümunə üçün dəyər vektoru kimi qiymətləndirəcəklər:

iki quyruqlu binomial test. Nəzərə alın ki, N=0 üçün test əskik qiymətə qiymətləndirilir və vektor indekslərini müəyyən etmək üçün FORMAT/GT istifadə edildikdə, homozigot genotiplər üçün 1-ə bərabər qiymətləndirir.

mövcud deyilsə tez hesablanan dəyişənlər: alternativ allellərin sayı nümunələrin sayı alternativ allellərin sayı kiçik allellərin sayı (AC-yə bənzəyir, lakin həmişə 0,5-dən kiçikdir) alternativ allellərin tezliyi (AF=AC/AN) kiçik allellərin tezliyi ( MAF=MAC/AN) çağırılan genotiplərdə allellərin sayı İndel uzunluğu çatışmayan genotip fraksiyasına malik nümunələrin sayı (silmə mənfi, daxiletmə müsbət)

ifadəni keçən nümunələrin sayı (N_PASS) və ya kəsir (F_PASS).

xüsusi perl filtrasiyası. Qeyd edək ki, bu əmr standart olaraq tərtib edilmir, bölməyə baxın Perl ilə Könüllü Kompilyasiya yardım üçün INSTALL faylında və işləyən nümunə üçün misc/demo-flt.pl. Demo, komanda xəttindən çağırıla bilən perl alt proqramını aşağıdakı kimi təyin etdi:

Sətirlərdəki vergül ayırıcı kimi şərh edilir və çoxlu qiymətlər müqayisə edildikdə OR məntiqindən istifadə edilir. Beləliklə, aşağıdakı iki ifadə ekvivalentdir, lakin üçüncü deyil:

Çoxsaylı dəyərlər sorğulanarkən bütün elementlər sınaqdan keçirilir və nəticədə OR məntiqindən istifadə edilir. Məsələn, "TAG=1,2,3,4" sorğusunda o, aşağıdakı kimi qiymətləndiriləcək:

Qabıq genişlənməsi:

Qeyd edək ki, ifadələr tez-tez sitat gətirilməlidir, çünki bəzi simvollar qabıqda xüsusi məna daşıyır. Bütün ifadənin nəzərdə tutulduğu kimi proqrama ötürülməsinə səbəb olan tək dırnaqlar içərisində olan ifadə nümunəsi:

Təfərrüatlar üçün qabığınızın sənədlərinə müraciət edin.


Çoxsaylı Qeydləri Kodlayın sonra Siz Məlumatları Toplu Toplayırsınız

The NIOSH Sənaye və Peşə Kompüterləşdirilmiş Kodlaşdırma Sistemi (NIOCCS) sənaye və peşə mətnini standartlaşdırılmış sənaye və peşə kodlarına çevirən pulsuz, veb əsaslı proqram təminatıdır. NIOCCS artıq topladığınız sənaye və peşə məlumatlarının böyük partiyalarını kodlayır.

1. gedin NIOCCS səhifəsi. Kodlaşdırmaq üçün çoxlu sayda qeydiniz varsa, Təhlükəsiz Giriş İdarəetmə Xidməti (SAMS) hesabı üçün qeydiyyatdan keçməlisiniz. Qeydiyyatdan keçmək üçün ad və soyadınızı və e-poçt ünvanınızı [email protected] ünvanına göndərin. Əgər kodlaşdırmaq üçün yalnız bir neçə qeydiniz varsa, siz hesab tələb etməyən tək qeyd kodlayıcısından istifadə edə bilərsiniz.

Kodlamağınız lazım olan sənaye və peşə mətnini təmin edin. Yalnız bir neçə qeydiniz varsa, onları fayl yükləmədən daxil edə bilərsiniz. Çoxlu qeydləriniz varsa, məlumatı fayl formatında yükləmək ən sürətlidir. NIOCCS-ə yüklənmiş fayllar Tab və ya Boru simvolu (|) ilə ayrılmış standart .txt fayl formatında olmalıdır və ən azı:

Təqdim edilən hər bir qeydin ID sahəsində bir dəyəri olmalıdır və Sənaye Başlığında və ya Peşə Başlığında ən azı bir dəyər olmalıdır – faylın necə görünə biləcəyinə dair bir nümunə burada göstərilir:

2.NIOCCS istifadə edərək kodlayın. NIOCCS daxil edilmiş bütün qeydləri avtomatik olaraq kodlayır, baxmayaraq ki, yaxşı məlumat daxil etməyiniz vacibdir. Səhv yazılar və ya natamam təsvirlər kimi daxil etdiyiniz vəzifə təsvirləri ilə bağlı problemlər varsa, çıxışınız o qədər də yaxşı olmayacaq.

3. Nəticələrinizi endirin. Kodlaşdırma prosesi başa çatdıqdan sonra, orijinal yüklənmiş məlumat və ya giriş məlumat sahələri, üstəgəl standartlaşdırılmış siyahıyaalma daxil olmaqla kodlanmış çıxış faylınızı endirə bilərsiniz., NAICS və SOC sənaye və peşə kodları.


Təsvir

Ay

Dolor Inc. və ya Convallis Limited kimi lorem ipsum sözü və uyğun şəkilçidən ibarət təsadüfi şirkət adı yaradır.

Bu Məlumat Tipi təsadüfi SIRET/SIREN Fransız biznes identifikasiya nömrəsi yaradır.

SIRET:

SİREN:

Daha çox məlumat:

Bəzi ölkələrdə sosial sığorta üçün istifadə edilən şəxsi nömrə yaradır. Hazırda yalnız isveçlilər dəstəklənir. Şəxsi nömrələr müəyyən etdiyiniz formata uyğun olaraq yaradılır:

PersonalNumberWithoutHyphen

PersonalNumberWithHyphen

Bəzi ölkələrdə şirkətlərin, assosiasiyaların və s. qeydiyyatı üçün istifadə olunan təşkilat nömrələrini yaradır. Hazırda yalnız İsveç nömrələri dəstəklənir. Təşkilat nömrələri təyin etdiyiniz formata uyğun olaraq yaradılır:

TəşkilatNömrəsiTiresiz

OrganisationNumberWithHyphen

Seçdiyiniz seçimlərə əsasən təsadüfi Kanada əyalətləri, əyalətləri, əraziləri və ya mahalları yaradır. The Tam adıİxtisar alt seçimlər çıxışın tam sətirdən (məsələn, "British Columbia") və ya onun abreviaturasından (məsələn, "BC") ibarət olub-olmadığını müəyyən edir. Böyük Britaniya əyalətləri üçün abreviatura standart 3 simvoldan ibarət Chapman kodudur.

Bu məlumat növü təsadüfi enlik və/yaxud uzunluq yaradır. Hər ikisi seçilibsə, hər ikisini vergüllə ayıraraq göstərir.

Bu məlumat növü təyin etdiyiniz formata uyğun olaraq təsadüfi, etibarlı kredit kartı nömrələri yaradır. Hal-hazırda aşağıdakı markalar üçün nömrələr yaratmağa qadirdir: Mastercard, Viza, Visa Elektron, American Express, Kəşf etmək, American Diner's, Carte Blanche, Diner's Club International, , JCB, Maestro, Solo, Keçid, Lazer.

1111-dən 9999-a qədər təsadüfi kredit kartı PIN nömrəsi yaradır.

111-dən 999-a qədər təsadüfi kredit kartı CVV nömrəsi yaradır.

Bu seçim standart lorem ipsum latın mətnindən çıxarılan müəyyən sayda təsadüfi sözlər yaradır.

Bu seçim təsadüfi sayda sözləri yaradır - sizin təyin etdiyiniz diapazondakı ümumi sayı (daxil olmaqla). Sabit nömrə seçimində olduğu kimi, sözlər standart lorem ipsum latın mətnindən çəkilir.

Bu Məlumat Tipi təsadüfi alfa-rəqəmli sətirlər yaratmağa imkan verir. Aşağıdakı cədvəldə bu sahə üçün simvol əfsanəsi var. Bu sahəyə daxil etdiyiniz hər hansı digər simvol qaçışsız görünəcək.

Lazım olan formatda Boolean dəyəri yaradır. Siz boru (|) simvolu ilə ayıraraq çoxlu formatları təyin edə bilərsiniz. Aşağıdakı sətirlər Boolean ekvivalentinə çevriləcək:

  • Hə ya yox
  • Yalan və ya Doğru
  • 0 və ya 1
  • Y və ya N
  • F və ya T
  • yalan və ya doğru

doğru və yanlış dəyərlər xüsusidir. İxrac növündən asılı olaraq, bunlar ikiqat dırnaq işarəsi olmadan verilə bilər.

Daxil etdiyiniz dəyərdən asılı olmayaraq hər bir sətirdə unikal nömrəni ehtiva edən sütun yaradır. Bu seçim avtomatik artım əsas açarı ilə verilənlər bazası sahəsinə məlumat daxil etmək üçün faydalı ola bilər.

İsteğe bağlı yertutan sətir yaradılan artım dəyərini sətir daxilində yerləşdirməyə imkan verir. yer tutucu. Misal üçün:

Bu, təyin etdiyiniz dəyərlər arasında təsadüfi bir rəqəm yaradır. Hər iki sahə mənfi ədədlər daxil etməyə imkan verir.

Bu məlumat növü istədiyiniz formatda və diapazonda təsadüfi valyuta dəyərləri yaradır. Nümunə açılan menyuda bir neçə variant var ki, siz onun necə işlədiyini başa düşəsiniz, lakin burada seçimlərin hər biri nə deməkdir.

Format

Aralığı - From

Aralığı - Kimə

Valyuta simvolu

Prefiks/Suffiks

Bu məlumat növü sətirdən sətrə təkrarlanan dəyərlərə malik verilənlər sütunu yaratmağa imkan verir. Bunun necə işlədiyi barədə sizə fikir vermək üçün bir neçə nümunə var.

  • Hər sətir üçün "1" dəyərini təqdim etmək istəyirsinizsə, siz Dəyər(lər) sahəsinə "1" və Döngə sayı sahəsinə istənilən dəyəri (>0) daxil edə bilərsiniz.
  • Əgər siz 100 sıra "Erkek" və ardınca 100 sıra "Qadın" sətirinə sahib olmaq və təkrarlamaq istəyirsinizsə, Döngü sayı sahəsinə "100" və Dəyər(lər) sahəsinə "Erkek|Qadın" daxil edə bilərsiniz.
  • Əgər 1-dən 10-a kimi 5 cərgəni bəyənirsinizsə, Döngə sayı sahəsi üçün "5" və Dəyər(lər) sahəsinə "1|2|3|4|5|6|7|8|9|10" daxil edin.

Onunla məşğul olmağa çalışın. Siz fikir əldə edəcəksiniz.

Kompozit məlumat növü sizə hər hansı digər sətir və ya sətirlərdən məlumatları birləşdirməyə, onları manipulyasiya etməyə, dəyişdirməyə, məlumatları birləşdirməyə və s. imkan verir. Məzmun Smarty şablon dilində daxil edilməlidir.

İstənilən sətirdən dəyəri çıxarmaq üçün sadəcə yertutanlardan istifadə edin , , və s. Siz cari sıraya istinad edə bilməzsiniz - bu ya serveri əridir və/yaxud kainatı partladar.

  • 6-cı sətirdən dəyəri göstərin:
  • 1-ci və 2-ci sətirlərin təsadüfi ədədlər olduğunu fərz etsək, aşağıdakılar bəzi sadə riyaziyyat nümunələridir:
    • - çıxma
    • - vurma
    • <$ROW2/$ROW1> - bölmə

    Sintaksis haqqında ətraflı məlumat üçün Smarty veb saytına baxın.

    Bu məlumat növü, ağacın gövdəsi olan ən birinci cərgə istisna olmaqla, hər bir cərgənin başqa cərgənin uşağı olduğu ağaca bənzər məlumatları yaratmağa imkan verir. Bu məlumat növü Avtomatik Artırma məlumat növü ilə birlikdə istifadə edilməlidir: bu, hər bir sətirin ana sətirlərə istinad etmək üçün istifadə etdiyi unikal rəqəmli dəyərə malik olmasını təmin edir.

    Seçimlər sizə forma sahələrindən hansının uyğun avtomatik artım sahəsi olduğunu və node ola biləcək maksimum uşaq sayını təyin etməyə imkan verir.

    Boru ilə ayrılmış elementlərin siyahısını daxil edin | xarakter. Sonra istədiyinizi seçin Tam olaraq X ədəd maddələr və ya Ən çox Siyahıdan X element. Birdən çox element nəticələrdə vergüllə ayrılmış siyahıda qaytarılır. Əgər məlumat dəstinizə boş dəyərlər daxil olmasını istəyirsinizsə, sonuna bir və ya daha çox boru simvolu əlavə edin - nə qədər çox boru daxil etsəniz, boş dəyərin yaranma ehtimalı bir o qədər çox olar.

    The Hesablanmış Data Type sizə həmin məlumat əsasında istədiyiniz nəticəni yaratmağınıza imkan vermək üçün cərgədəki sahələr haqqında metadataya giriş imkanı verir. Yalnız daxil olmaq lazımdırsa yaradılmışdır başqa sahədən sətir dəyəri (yəni, çıxışda gördüyünüz), baxın Kompozit Məlumat növü. Bu sahə növü sizə hər bir sahəyə daha çox giriş imkanı verir.

    , və s. həmin cərgə haqqında mövcud olan hər şeyi ehtiva edir. Məzmun cərgənin Məlumat Tipinə və yaradılanlara əsasən dəyişir, lakin yüksək səviyyədə aşağıdakı xüsusiyyətləri ehtiva edir:

    • - sətir üçün interfeys/API çağırışına hansı seçimlər daxil edilmişdirsə
    • - Məlumat Növü üçün qaytarılan hər hansı əlavə metadata
    • - bu sahə üçün faktiki yaradılan təsadüfi məzmun (həmişə "ekran" xüsusiyyətindədir) üstəgəl yaradılan məzmun haqqında hər hansı digər məlumat
    • - sıradakı hər şeyin lazımlı JSON seriyası, beləliklə, mövcud olanları görə bilərsiniz. Sadəcə onu JSON formatlayıcısı vasitəsilə işə salın.
    • - yaradılan məzmunun cinsini ("kişi", "qadın" və ya "naməlum") çıxaracaq Adlar Məlumat növü sahəsi ("1"-i sağ sıra nömrəsi ilə əvəz etməyinizə əmin olun!). Əgər istifadə etsəniz Qadın Adı yer tutucu sətir kimi bu dəyişən hər dəfə "qadın" qaytaracaq. Əgər "Ad" daxil etsəniz, qaytarılan dəyər yaradılan sətirdən asılı olacaq. Çox formatlı yertutan sətir daxil etmisinizsə, o, hər iki cinsi ehtiva edirsə və ya cins yoxdursa (məsələn, adsız soyad) “naməlum”u qaytaracaq.

    de-nied. Bu Data Setini digər insanlarla paylaşmaq üçün əvvəlcə onu yadda saxlamalısınız.

    Mən başa düşürəm ki, bu Data Setini paylaşmaq üçün onu ictimailəşdirməliyəm.

    İstifadəçiyə giriş məlumatlarını e-poçtla göndərin

    Bu istifadəçi hesabını silmək istədiyinizə əminsiniz?

    Ad
    Soyad
    E-poçt

    Sizdə paketləşdirmə/kiçilmə aktivdir. Pluginləri Sıfırla düyməsini klikləsəniz, işə başlamalı olacaqsınız homurdanmaq paketləri yenidən yaratmaq üçün. Ətraflı məlumat üçün bu sənəd səhifəsini oxuyun. Hər hansı bir probleminiz varsa, paketləşdirməni söndürmək istəyə bilərsiniz.

    Haqqında

    Xüsusi formatlaşdırılmış nümunə/test məlumatlarına ehtiyacınız olubmu? Bax, bu ssenarinin ideyası budur. Bu JavaScript, PHP və MySQL dillərində yazılmış pulsuz, açıq mənbəli alətdir ki, proqram təminatının sınaqdan keçirilməsi, verilənlər bazalarının doldurulması və istifadə üçün müxtəlif formatlarda böyük həcmli xüsusi verilənləri tez bir zamanda yaratmağa imkan verir. sairə və s.

    Bu sayt onlayn demo təqdim edir, burada skriptin nə etdiyini, hansı funksiyaları təklif etdiyini və necə işlədiyini başa düşmək üçün ətrafa baxa bilərsiniz. Sonra, iştahınızı açdıqdan sonra, yükləmək üçün pulsuz, tam funksional, GNU lisenziyalı versiya mövcuddur. Alternativ olaraq, onu öz serverinizdə quraşdırmaq çətinliyindən qaçmaq istəyirsinizsə, bu saytda bir hesab əldə etmək üçün 20 ABŞ dolları və ya daha çox ianə verə bilərsiniz və bu, bir anda 5000-ə qədər qeyd yaratmağınıza imkan verir (maksimum 100 əvəzinə), və məlumat dəstlərinizi saxlamaq imkanı verir. Əlavə məlumat üçün Bağışla sekmesine klikləyin.

    Onu uzat

    Hazır skript ümumiyyətlə sizə lazım olan funksionallığı ehtiva edir. Ancaq heç bir şey tam deyil - ola bilsin ki, təsadüfi ezoterik riyazi tənliklər yaratmalı, təsadüfi tvitlər çəkməli və ya Flickr-dan başlıqda "Qırmızı dayaqlı siçan" sözü olan təsadüfi şəkilləri göstərməlisiniz. Kim bilir. Hər kəsin istifadə vəziyyəti fərqlidir.

    Bunu nəzərə alaraq, skriptin yeni versiyası (3.0.0+) tam genişləndirilə bilən şəkildə hazırlanmışdır: tərtibatçılar təsadüfi məlumatların yeni növlərini yaratmaq üçün öz Məlumat Növlərini yaza və hətta İxrac Növlərini - yəni formatı fərdiləşdirə bilərlər. hansı məlumatlar çıxarılır. Daha dəqiq lokallaşdırılmış coğrafi məlumat yaratmaqda maraqlı olan insanlar üçün onlar seçdikləri ölkə üçün bölgə adlarını (ştatlar, əyalətlər, ərazilər və s.), şəhər adlarını və poçt/poçt kodu formatlarını təmin edən yeni Ölkə plaginləri əlavə edə bilərlər. Bütün bunlar haqqında ətraflı məlumat üçün Developer Sənədlərinə müraciət edin.

    Yüklə

    Github-dan skriptin ən son versiyasını yükləmək üçün aşağıdakı düyməni basın. Əlavə məlumat üçün İstifadəçi Sənədlərinə baxın.

    Layihə xəbərləri

    İstifadəçi hesabları

    Bu bölmə insanlara skriptə daxil olmaq üçün istənilən sayda istifadəçi hesabı yaratmağa imkan verir. Yalnız siz hesab yarada və ya silə bilərsiniz.

    Hələ heç bir istifadəçi hesabı əlavə edilməyib.

    İndi ianə edin!

    Əgər bu sizə işinizdə kömək edibsə, ianə həmişə yüksək qiymətləndirilir! Əgər ümumi xeyirxahlıq hissi sizi ianə verməyə inandırmaq üçün kifayət etmirsə, burada daha bir neçə maddi stimul var:

    • Layihəyə dəstək böyük yeni xüsusiyyətlərə gətirib çıxarır! Dürüst!
    • $20 və ya daha çox ianə etmək sizə bu saytda istifadəçi hesabı qazandıracaq. İstifadəçi hesabı ilə siz:
      • Maksimum 100 əvəzinə bir anda 10.000-ə qədər sıra yaradın.
      • Forma konfiqurasiyalarınızı yadda saxlayın ki, sayta hər dəfə qayıtdığınız zaman məlumat dəstlərinizi yenidən yaratmağa ehtiyac qalmasın.

      Bağış etdiyiniz hər 20 dollar əlavə edir il hesabınıza. Hesabınıza daha çox vaxt əlavə etmək üçün daha gec qayıda bilərsiniz - o, cari vaxtınızın sonuna əlavə olunacaq. Eyni e-poçt ünvanı ilə ianə etməyinizə əmin olun. Əgər ianə verməkdə və ya istifadəçi hesabınızla bağlı hər hansı bir probleminiz varsa, mənə zəng edin.

      İanə etdikdən sonra, hesabınızın qurulmasını necə bitirəcəyinizə dair ətraflı məlumat e-poçtunuza göndəriləcək (spam qovluğunuzu yoxlayın!). Hər hansı bir probleminiz varsa, mənimlə əlaqə saxlayın.


      Videoya baxın: Full Form of VCF (Iyun 2022).