Show
Ignore:
Timestamp:
24.01.2017 21:54:12 (3 years ago)
Author:
davidb
Message:

collection-to-workset now with id-check added to filter

Files:
1 modified

Legend:

Unmodified
Added
Removed
  • other-projects/hathitrust/wcsa/vol-checker/src/org/hathitrust/extractedfeatures/VolumeCheck.java

    r31348 r31352  
    213213            BufferedReader reader = new BufferedReader(isr); 
    214214             
    215             StringBuilder sb = new StringBuilder(); 
     215            StringBuilder workset_friendly_sb = new StringBuilder(); 
     216            StringBuilder workset_unfriendly_sb = new StringBuilder(); 
     217             
    216218            String line = null; 
     219            int ci = 0; 
    217220            while ((line = reader.readLine()) != null) 
    218221            { 
    219                 sb.append(line + "\n"); 
     222                if (ci==0) { 
     223                    workset_friendly_sb.append("#" + line + "\n"); 
     224                } 
     225                else { 
     226                    int first_tab_pos=line.indexOf("\t"); 
     227                    String id = (first_tab_pos>0) ? line.substring(0, first_tab_pos) : line; 
     228                     
     229                    if (id_check_.containsKey(id)) { 
     230                        workset_friendly_sb.append(line + "\n");         
     231                    } 
     232                    else { 
     233                        workset_unfriendly_sb.append("#" + line + "\n"); 
     234                    } 
     235                } 
     236                 
     237                ci++; 
    220238            } 
    221239               
    222240            response.setContentType("text/plain"); 
    223241            PrintWriter pw = response.getWriter(); 
    224             pw.append(sb.toString()); 
     242            pw.append(workset_friendly_sb.toString()); 
     243            pw.append("## The following volumes are not in the HTRC Extracted Feature dataset\n"); 
     244            pw.append(workset_unfriendly_sb.toString()); 
    225245        } 
    226246        catch (Exception e) { 
     
    242262        String cgi_convert_col = request.getParameter("convert-col"); 
    243263         
    244         System.err.println("**** cgi_convert_col = '" + cgi_convert_col + "'"); 
     264        //System.err.println("**** cgi_convert_col = '" + cgi_convert_col + "'"); 
    245265         
    246266        if (cgi_ids != null) {