如何在短时间内速读百万字小说? 如何从海量小说中找到最有改编潜力的IP? 如何利用人工智能寻找阅读或分析文本时容易被忽视的“盲点”? 近两年来,上海作家邹藻从未停止过思考这些事情。
邹再的第一份工作是在一家外企。 后来他成为作家,加入上海作家协会,并在《收获》杂志任编辑近十五年。 2017年底,他选择了创业。 作家、白领、编辑、企业家、产品经理……她的职业标签不断变化,但始终与“文本”紧密相关。
10月18日,邹文来到华东师范大学创意写作专业“大师创作讲座”系列课程第四期,以“故事曲线与写作”为主题,分享了她对文本与写作的理解。文本代码”。 华东师范大学中文系副教授向京主持活动。
面对一群创意写作的学生可以写小说的软件,邹再说道:“什么是创意?我觉得不是想象力或者独特的想法,而是你是否有跨界融合的好奇心和野心。”
10月18日,邹文来到华东师范大学创意写作专业“大师创作讲座”系列课程第四期,以“故事曲线与写作”为主题,分享了她对文本与写作的理解。文本代码》.叶杨丽图
人工智能和大数据为文本分析带来新的可能性
刚离开《收获》时,很多同事都以为邹哉会从事版权交易。 “我是从影视进入这个行业的,发现影视公司对文学的理解和我们不一样可以写小说的软件,他们更看重网络文学。但我十几年专注纯文学,从来没有读过一篇登上排行榜的在线文章。”
接触网络文学后,邹再立刻发现了一个“痛苦”的事情——网络文学太长了。 按照她当纯文学编辑时的阅读速度,读完长篇网络小说就会“瞎”。
这种“痛苦”对于影视公司来说也同样存在,因为他们要从数千部网络小说中挑选出最有价值的翻拍作品。 “我只是想,有没有办法在视觉上简化一下,让人们能够快速掌握小说的情节?”
抱着这样的初衷,左左创业团队开发了一款软件“一夜·故事”,可以提取文本关键元素、计算关键词分布和关系、绘制全文情感曲线。 有了这个软件,无论是纯文学还是网络文学,无论小说多长,读者都可以清楚地了解小说的戏剧高潮、故事进展、情感曲线等。
去年,复旦大学中文系博士生邹早和詹玉冰利用软件对《收获》自1979年复刊以来发表的680位作者的1618篇小说进行了分析。通过对小说文本的词频数据分析,他们发现: 《收获》第一个十年(1979-1989)发表的作品中高频词是“我要”,这符合“文革”后个人主体性和自我意识觉醒的表达欲望增加; 第二个十年(1990-1999),表达主体从“我”扩展到“我们”,“家庭”伦理关系成为最受关注的话题; 第三个十年(2000-2009),自我表达仍是小说创作的主流,但“我们”与“他们”的明确划分,体现了社会阶层的分化和固化; 第四个十年(2010-2018),文学创作恢复对日常生活的关注、描述和书写。
“软件是一个工具,可以帮助你观察文本的特征,帮助你验证你的阅读直觉。有时它甚至可以让你突然发现阅读时没有想到的角度。”
借助“一夜·故事集”软件,对《收获》1979年至2018年发表的1618篇小说文本进行词频数据统计分析。
顶尖作品与网络文学“高频词”有什么区别?
第十届茅盾文学奖揭晓后,他们用软件对48部茅盾文学奖获奖作品的“场景高频词”进行了统计分析,并与中国101部《奇幻奇幻在线》进行了对比。 2018年“小说”与315部“现代生活情感网络小说”的“场景高频词”数据进行交叉比对。
对比发现,历届毛奖获奖作品中“心”字的出现频率明显高于2018年两大类网络小说。奇幻玄幻网络小说更偏爱“体”、“心”等表达方式和“心”,而现代生活和情感网络小说都离不开“父母的缺点”。
“这是一个非常有趣的现象。‘心’作为获奖作品中出现的高频词,反映出传统作家注重内心声音的呈现和人物思想精神的刻画。这也是符合我们对“严肃文学”的想象和认知。而且“在心里”、“在心里”和“在心里”还不是同一个词。网络玄幻多是时光、爱情、古装等古装故事。太空旅行,所以比较常用的是类似古典叙事的‘在心里’或者‘在心里’这样的词。”
历届毛奖获奖作品及2018年网络小说两大类别前15名“情景高频词”
不过,也有特例,比如李二的《应物哥哥》。 早走说,这部小说在“十五个常见场景词”中没有“心”字。 也是48部毛奖获奖作品“TOP 15频繁场景词”中唯一没有“心”字的作品。
“一方面是因为李耳在小说中采用了近乎冷酷的客观叙事态度来取代主观抒情和心理描写,另一方面是因为小说采用了相当复杂的叙事视角,经常出现在第一章和第二章。2.第三人称和第三人称之间频繁跳跃的写作技巧。 走走提到,“应物哥”经常使用“他问自己”、“他听到自己说”等表达方式,将心理描述转化为近乎主客体的二元性。 作者之间的对话。
“这可能会激发我们的创意写作学生对词语的使用有更精确的掌握和完善。”
利用“一业·故事集”软件分析《收获》中明暗作品比例的年度变化
通过阅读,了解语言背后的内容
经过两年的创业,早早从原来的“舒适区”跳入了一个与影视平台、制片人、投资人等打交道的世界,她就此写了一本小说《想跳进火里》。
“我开始用第一人称写作,但回头看,我发现有一种怨恨感。这种怨恨是技术无法控制的,是一种无法控制的宣泄表达。” 早走说:“为了化解怨恨,我又用了第二人称。所以这本小说总共有两个声音,第一个是‘我’,第二个是‘你’。我发现用第二人称写可以起到舒缓的作用,给自己更多的理解和关怀,但情感宣泄的部分会减弱,在使用第三人称“他”时,作者完全转向他人的视角,与人物保持一定的距离小说里。”
有学生问,缺乏生活经验的年轻作家如何在网络文学和严肃文学之间找到出路? 左左给出的答案是“读书”——试图通过阅读经典文本来表达生活细节。
她以珀尔·帕特森的《我抵抗》为例解读小说中的“错位”。 “小说的最后,母亲离家出走,多年后死在异国他乡。在与牧师聊天时,女儿发现母亲留下了一个鞋盒,鞋盒里装的是什么?” 早走说:“是的。一个小相框,里面有四个孩子的照片。我女儿看到这张照片就觉得不对劲,因为照片上的孩子虽然头上戴着合适的丝带,穿着合适的鞋子,但他们是找错人了。”
“原来这些照片是妈妈从不同的画报上剪下来,最后拼到一起的。” 在早走看来,“这种‘错位’的叙事值得学习和深思。如果只写妈妈离家出走时的生活,如果把孩子的照片拿走,就不会有这种感觉了。”母亲在相框中拼贴类似的肖像,实际上是在重构孩子在记忆中的形象。这种渴望的表达比直接书写更加微妙和深刻。”
仔仔说:“读文字的时候,如果看不到细节,看不到语言背后的内容,那基本上是白费力气。我们需要看作者如何处理细节,知道他为什么这样写,所以让他在写作的时候能够有意识地使用它,把这些东西带进来。