WPF开发txt阅读器实现目录提取功能

 更新时间:2023年06月06日 09:27:37   作者:微小冷  
这篇文章主要为大家详细介绍了WPF开发txt阅读器时如何实现目录提取功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下

目录类

目录是由标题组成,而标题往往包括章节序号以及标题名称,而对于一个文本文件来说,如果想实现点击目录实现跳转,则又必须包含该标题在正文中出现的位置。所以,在新建目录之前,首先应该新建一个章节类。

class Section
{
    public int order;
    public int location;        //文字位置
    public string title;

    public Section(int order, string title)
    {
        this.order = order;
        this.title = title;
    }

    public Section(int order, string title, string txt, int st=0)
    {
        this.order = order;
        this.title = title;
        location = txt.IndexOf(title, st);
    }
    
    public Section(int order, string title, int location)
    {
        this.order = order;
        this.title = title;
        this.location = location;
    }

}

其中,IndexOf用于定位字符串在文本文档中出现的第一个位置,st为开始搜索的字符串位置。

有了章节之后,就可以创建目录了,简单地来说,目录就是章节列表,但除此之外,还需要有生成目录的方法,其大致内容如下

class Catalog
{
    public List<Section> sections;
    public Catalog(string txt, bool withCatalog)
    {
​​​​​​​    }
}

提取标题

一般来说,txt中并不包含目录信息,所谓生成目录,无非是从文本文档中提取标题,所以需要分析标题的特点。

此外,有一些文本文档会在正文之前列出目录,这种可以把目录提取出来之后,再从文档中查找相应的章节,相对来说会更加方便,考虑到先易后难的原则,首先实现这种目录生成逻辑,在Catalog类的构造函数中,当withCatalog为true时,表示这种情况,下面是具体实现方法

public int maxSecLength = 30;       // 标题最长字数
public string[] ex = new string[] { "。", "." };

public bool isSection(string paragraph)
{
    if (paragraph.Length > maxSecLength)
        return false;
    foreach (var ch in ex)
        if (paragraph.Contains(ch))
            return false;
    return true;
}


public void extractCatalog(string txt)
{
    int i = 0, num = 0;     //i是章节号;num是章节位置
    foreach (var p in txt.Split("\r\n"))
    {
        num += p.Length;
        if (p.Trim().Length == 0)
            continue;

        if (!isSection(p))
            break;
        secs.Add(new Section(i++, p, txt, num));
    }
}

其中,isSection用于判断某个段落是否为目录,其判断目录的方法有两个,首先文字太长肯定不是目录,其次,如果出现了句号,也不是标题。

extracCatalog表示从txt中提取目录。由于假定文本文档以目录开头,所以当循环到某一行,当其不符合章节名称的要求时,就直接退出。

搜索标题

相应地,直接从文本中挑选目录从实现上来说更加简单,但具体识别效果可能会比较差

public void findCatalog(string txt)
{
    int i = 0, num = 0;     //i是章节号;num是章节位置
    foreach (var p in txt.Split("\r\n"))
    {
        num += p.Length;
        if (!isSection(p))
            break;
        secs.Add(new Section(i++, p, num - p.Length));
    }
}

到此这篇关于WPF开发txt阅读器实现目录提取功能的文章就介绍到这了,更多相关WPF阅读器内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • C#预定义数据类型之值类型和引用类型介绍

    C#预定义数据类型之值类型和引用类型介绍

    这篇文章主要介绍了C#预定义数据类型之值类型和引用类型介绍,本文着重讲解了引用类型中的object(对象)类型和string(字符串)类型,需要的朋友可以参考下
    2015-03-03
  • C#实现合并及拆分PDF文件的方法

    C#实现合并及拆分PDF文件的方法

    这篇文章主要为大家详细介绍了C#合并及拆分PDF文件的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-01-01
  • C#文件内容检索的功能实现代码

    C#文件内容检索的功能实现代码

    本文详细介绍了如何构建和优化一个高效的文件内容检索系统,包括索引构建、多线程处理、文件监控、搜索优化、错误处理和日志记录等方面的内容,并提供了一个简化的C#demo示例,感兴趣的朋友一起看看吧
    2024-10-10
  • 总结的5个C#字符串操作方法分享

    总结的5个C#字符串操作方法分享

    这篇文章主要介绍了总结的5个C#字符串操作方法分享,本文讲解了把字符串按照分隔符转换成 List、把字符串转 按照, 分割 换为数据、得到数组列表以逗号分隔的字符串、得到字符串长度等方法,需要的朋友可以参考下
    2015-05-05
  • C#实现基于XML配置MenuStrip菜单的方法

    C#实现基于XML配置MenuStrip菜单的方法

    这篇文章主要介绍了C#实现基于XML配置MenuStrip菜单的方法,涉及C#使用XML配置MenuStrip菜单的原理与实现技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-08-08
  • 使用C#实现网页内容保存为图片并生成压缩包

    使用C#实现网页内容保存为图片并生成压缩包

    这篇文章主要为大家详细介绍了如何使用C#实现网页内容保存为图片并生成压缩包,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2024-02-02
  • 基于C#实现简单的音乐播放器

    基于C#实现简单的音乐播放器

    这篇文章主要介绍了如何基于C#实现简单的音乐播放器,考虑到需求中的界面友好和跨版本兼容性,我们可以选择选择Windows Forms作为开发平台,Windows Forms提供了一个简单而强大的方法来创建桌面应用程序,文中通过代码示例给大家讲解的非常详细,需要的朋友可以参考下
    2024-05-05
  • unity 如何获取Text组件里text内容的长度

    unity 如何获取Text组件里text内容的长度

    这篇文章主要介绍了unity 获取Text组件里text内容的长度操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • C# 利用ICSharpCode.SharpZipLib实现在线压缩和解压缩

    C# 利用ICSharpCode.SharpZipLib实现在线压缩和解压缩

    本文主要主要介绍了利用ICSharpCode.SharpZipLib第三方的DLL库实现在线压缩和解压缩的功能,并做了相关的代码演示。
    2016-04-04
  • C#实现坦克大战游戏

    C#实现坦克大战游戏

    这篇文章主要为大家详细介绍了C#实现坦克大战游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-07-07

最新评论