Changeset 33031 for other-projects

Show
Ignore:
Timestamp:
22.04.2019 14:58:53 (4 months ago)
Author:
cpb16
Message:

Completed numpages checking. Generated makefiles and scripts to streamline process. Need to now fix 'no such file or directory error from the RUN-META.sh file'.

Location:
other-projects/is-sheet-music-encore/trunk
Files:
3 added
5 modified

Legend:

Unmodified
Added
Removed
  • other-projects/is-sheet-music-encore/trunk/-COMPX520-README.txt

    r33017 r33031  
    11INSTRUCTIONS 
     2 
     3The RUN scripts, think that some IDs are directories. Correct this 
     4 
    25TEST CORPUS GENERATION 
    36(java-gen-corpus/..): 
     
    1417(COMPX520-DOWNLOADER-PNG.txt , COMPX520-RUN-PNG.sh , ddapiclient2-extended.pl 
    1518"source ./SETUP.bash" 
    16 "./COMPX520-DOWNLOADER-PNG.txt <java-gen-corpus/filename> <page_num>" 
    17  
    18  
     19"./COMPX520-DOWNLOADER-PNG.sh <java-gen-corpus/filename> <page_num>" 
    1920 
    2021 
     
    2223(COMPX520-DOWNLOADER-ZIP.txt , COMPX520-RUN-XIP.sh , ddapiclient2-extended-ZIP.pl): 
    2324 
    24   "./COMPX520-DOWNLOADER-ZIP.txt <java-gen-corpus/filename>" 
     25  "./COMPX520-DOWNLOADER-ZIP.sh <java-gen-corpus/filename>" 
    2526 
    2627 
  • other-projects/is-sheet-music-encore/trunk/java-gen-corpus/TabProcMetaListGen.java

    r33017 r33031  
    1313                 
    1414                 
    15             if (args.length != 1) { 
    16                 System.out.println("Usage: TabProcMetaListGen <inputFilename> <outputFilename>"); 
     15            if (args.length != 2) { 
     16                System.out.println("Usage: TabProcMetaListGen <inputFilename> <listFilename>"); 
    1717            } 
    1818            else { 
     19                //Variables 
    1920                String inputFilename = args[0]; 
    20                 //String outputFilename = args[1]; 
    21                      
     21                String listFilename = args[1];       
     22                FileReader fileReader = new FileReader(inputFilename); 
     23                BufferedReader buf = new BufferedReader(fileReader); 
     24                FileWriter listWriter = new FileWriter(listFilename, true); 
     25                String line = null; 
     26                String[] item; 
     27                 
     28                String idLine = null; 
     29                String id = null; 
     30                String numpages = null; 
     31                                     
    2232                System.out.println("Processing: " + inputFilename); 
    2333                 
    24                 FileReader fileReader = new FileReader(inputFilename); 
    25                 BufferedReader buf = new BufferedReader(fileReader); 
    26                 //FileWriter fw = new FileWriter(outputFilename); 
    27                 String line = null; 
    28                 String[] item; 
    29  
    3034                //Splits into each record 
    31                 while ((line = buf.readLine()) != null) { 
    32                      
    33                     //Splits by tab, leaves "" for every blank entry 
    34                     //Check items to be equal 
    35                     //System.out.println(line); 
     35                while ((line = buf.readLine()) != null) {                    
     36                    if(line.contains("<id>")){ 
     37                        //Isoclate and store the id from the line 
     38                        idLine = line.substring(line.indexOf(">")+1, line.indexOf("</")); 
     39                        id  = idLine.substring(idLine.lastIndexOf("meta/")+5); 
     40                         
     41                    }    
    3642                    if(line.contains("<htd:numpages>")){ 
    37                         String result = line.substring(line.indexOf(">")+1, line.indexOf(">")+2); 
    38                         System.out.println(result);                      
    39                     } 
    40                     if(line.contains("<id>")){ 
    41                         String result = line.substring(line.indexOf(">")+1, line.indexOf("</")); 
    42                         System.out.println(result); 
    43                     } 
    44                              
    45                 }        
     43                        //Iscolate and store the page number 
     44                        numpages = line.substring(line.indexOf(">")+1, line.lastIndexOf("<")); 
     45                                         
     46                    }                                            
     47                } 
     48                 
     49                //Check if there are more than 10 pages 
     50                if(Integer.parseInt(numpages) >= 10){ 
     51                //Add extracted metadata to output list 
     52                listWriter.write(id + '\t' + numpages + '\n'); 
     53                } 
    4654                buf.close(); 
    47                 //fw.close(); 
     55                listWriter.close(); 
    4856            } 
    4957        }catch(Exception e){ 
  • other-projects/is-sheet-music-encore/trunk/java-gen-corpus/TabProcTextGen.java

    r33009 r33031  
    6060} 
    6161 
    62 //REFERNECES 
     62//REFERNECES  
    6363//https://www.javatpoint.com/java-filewriter-class 
    6464//https://docs.oracle.com/javase/8/docs/api/index.html?java/io/FileWriter.html 
  • other-projects/is-sheet-music-encore/trunk/java-gen-corpus/TabRndListGen.java

    r33007 r33031  
    1212    try{ 
    1313        if (args.length != 3){ 
    14         System.out.println("Usage: RandomItemSelecta <inputFilename> <outputCount> <outputFilename>"); 
     14        System.out.println("Usage: TabRndListGen <inputFilename> <outputCount> <outputFilename>"); 
    1515        } 
    1616        else{ 
     
    2727        ArrayList<String> subList; 
    2828        String line = null; 
     29        String[] item; 
    2930 
    3031        //Add items to Array 
    3132        while ((line = buf.readLine()) != null) { 
    32             list.add(line);      
     33            //Split line by tab 
     34            item = line.split("\t", -1); 
     35            //Add first element (ID) 
     36            list.add(item[0]);       
    3337        } 
    3438        //randomize list