encoding.csv module

2019-08-14 16:45:56 +10:00 · 2019-08-14 16:45:56 +10:00 · 7b48f7ac9e
parent f52c68a510
commit 7b48f7ac9e
2 changed files with 177 additions and 0 deletions
--- a/vlib/encoding/csv/csv_test.v
+++ b/vlib/encoding/csv/csv_test.v
@ -0,0 +1,33 @@
 import encoding.csv
 fn test_encoding_csv() {
 	// test reading
 	data := 'name,email,phone,other\njoe,joe@blow.com,0400000000,test\nsam,sam@likesham.com,0433000000,"test quoted field"\n#chris,chris@nomail.com,94444444,"commented row"\nmike,mike@mikesbikes.com,98888888,"bike store"\n'
 	mut csv_reader := csv.new_reader(data)
 	mut row_count := 0
 	for {
 		row := csv_reader.read() or {
 			break
 		}
 		row_count++
 		if row_count== 1 {
 			assert row[0] == 'name'
 		}
 		if row_count == 2 {
 			assert row[0] == 'joe'
 		}
 		if row_count == 3 {
 			assert row[0] == 'sam'
 			// quoted field
 			assert row[3] == 'test quoted field'
 		}
 		if row_count == 4 {
 			assert row[0] == 'mike'
 		}
 	}
 	assert row_count == 4
 	// test writing to come
 }
--- a/vlib/encoding/csv/reader.v
+++ b/vlib/encoding/csv/reader.v
@ -0,0 +1,144 @@
 module csv
 // Copyright (c) 2019 Alexander Medvednikov. All rights reserved.
 // Use of this source code is governed by an MIT license
 // that can be found in the LICENSE file.
 // Once interfaces are further along the idea would be to have something similar to
 // go's io.reader & bufio.reader rather than reading the whole file into string, this
 // would then satisfy that interface. I designed it this way to be easily adapted.
 const (
 	err_comment_is_delim = error('encoding.csv: comment cannot be the same as delimiter')
 	err_invalid_delim    = error('encoding.csv: invalid delimiter')
 	err_eof              = error('encoding.csv: end of file')
 	err_invalid_le       = error('encoding.csv: could not find any valid line endings.')
 )
 struct Reader  {
 	// not used yet
 	// has_header        bool
 	// headings          []string
 	data              string
 mut:
 	delimiter         byte
 	comment           byte
 	is_mac_pre_osx_le bool
 	row_pos           int
 }
 pub fn new_reader(data string) *Reader {
 	return &Reader{
 		delimiter: `,`,
 		comment: `#`,
 		data: data
 	}
 }
 // read() reads one row from the csv file
 pub fn (r mut Reader) read() ?[]string {
 	l := r.read_record() or {
 		return error(err)
 	}
 	return l
 }
 // Once we have multi dimensional array
 // pub fn (r mut Reader) read_all() ?[][]string {
 // 	mut records := []string
 // 	for {
 // 		record := r.read_record() or {
 // 			if error(err).error == err_eof.error {
 // 				return records
 // 			} else {
 // 				return error(err)
 // 			}
 // 		}
 // 		records << record
 // 	}
 // 	return records
 // }
 fn (r mut Reader) read_line() ?string {
 	// last record
 	if r.row_pos == r.data.len {
 		return err_eof
 	}
 	le := if r.is_mac_pre_osx_le { '\r' } else { '\n' }
 	mut i := r.data.index_after(le, r.row_pos)
 	if i == -1 {
 		if r.row_pos == 0 {
 			// check for pre osx mac line endings
 			i = r.data.index_after('\r', r.row_pos)
 			if i != -1 {
 				r.is_mac_pre_osx_le = true
 			} else {
 				// no valid line endings found
 				return err_invalid_le
 			}
 		}
 	}
 	mut line := r.data.substr(r.row_pos, i)
 	r.row_pos = i+1
 	// normalize win line endings (remove extra \r)
 	if !r.is_mac_pre_osx_le && (line.len >= 1 && line[line.len-1] == `\r`) {
 		line = line.left(line.len-1)
 	}
 	return line
 }
 fn (r mut Reader) read_record() ?[]string {
 	if r.delimiter == r.comment {
 		return err_comment_is_delim
 	}
 	mut line := ''
 	for {
 		l := r.read_line() or {
 			return error(err)
 		}
 		line = l
 		// skip commented lines
 		if line[0] == r.comment {
 			continue
 		}
 		break
 	}
 	mut fields := []string
 	mut i := -1
 	for {
 		// not quoted
 		if line[0] != `"` {
 			i = line.index(r.delimiter.str())
 			if i == -1 {
 				// last
 				break
 			}
 			fields << line.left(i)
 			line = line.right(i+1)
 			continue
 		}
 		// quoted
 		else {
 			line = line.right(1)
 			i = line.index('"')
 			if i+1 == line.len {
 				// last record
 				fields << line.left(i)
 				break
 			}
 			next := line[i+1]
 			if next == r.delimiter {
 				fields << line.left(i)
 				line = line.right(i)
 				continue
 			}
 			line = line.right(1)
 		}
 		if i <= -1 && fields.len == 0 {
 			return err_invalid_delim
 		}
 	}
 	return fields
 }